Equal-Width-Binning Operator


Operator 설명

Operator 파라미터 설명

작동순서

  1. 입력 DataFrame의 유효성 검사를 진행한다. (Numeric Columns, Bins 유효성 검사)
  2. Bins 구간을 설정한다. (Bins 간격을 구하는 방법은 해당 칼럼의 데이터의 (최대값 – 최소값) / Bins의 개수)
  3. 선택된 칼럼의 데이터를 범위 형태로 변환을 한다.
  4. 출력 DataFrame을 생성한다.

Operator 모듈 테스트 결과

입력 데이터

original_data index
2 0
3 1
4 2
5 3
6 4
7 5
8 6
9 7
10 8
12 9
14 10

결과 데이터

original_data result
2 range1[-Infinity-...
3 range1[-Infinity-...
4 range1[-Infinity-...
5 range2[5.000000-8...
6 range2[5.000000-8...
7 range2[5.000000-8...
8 range3[8.000000-11...
9 range3[8.000000-11...
10 range3[8.000000-11...
12 range4[11.000000-...
14 range4[11.000000-...
val equalWidthBinningInfo = EqualWidthBinningInfo.newBuilder()
  .addSelectedColumnId(0)
  .setNumberOfBins(4)
  .setOutputType(OutputType.NEW_COLUMN)
  .build