Equal-Depth-Binning Operator


Operator 설명

Operator 파라미터 설명

작동순서

  1. 입력 DataFrame의 유효성 검사를 진행한다. (Numeric Columns, Bins 유효성 검사)
  2. 입력 DataFrame의 선택된 칼럼을 정렬한다. (asc)
  3. Bins 안에 들어가야하는 이상적인 개수를 미리 설정한다.
  4. Bins 구간을 설정한다. ((현재 데이터 – 이전데이터) / 2를 하여 구간 간격을 조율함)
  5. 선택된 칼럼의 데이터를 범위 형태로 변환을 한다.
  6. 출력 DataFrame을 생성한다.

Operator 모듈 테스트 결과

입력 데이터

original_data index
0 0
4 1
12 2
16 3
16 4
18 5
24 6
26 7
28 8

결과 데이터

original_data result
0 range1[-Infinity-...
4 range1[-Infinity-...
12 range1[-Infinity-...
16 range2[14.000000-...
16 range2[14.000000-...
18 range2[14.000000-...
24 range3[21.000000-...
26 range3[21.000000-...
28 range3[21.000000-...
val equalDepthBinningInfo = EqualDepthBinningInfo.newBuilder()
  .addSelectedColumnId(0)
  .setNumberOfBins(3)
  .setOutputType(OutputType.NEW_COLUMN)
  .build