뉴머라이 편집하기
편집을 되돌릴 수 있습니다.
이 편집을 되돌리려면 아래의 바뀐 내용을 확인한 후 저장해주세요.
최신판 | 당신의 편집 | ||
14번째 줄: | 14번째 줄: | ||
이러한 과적합 문제를 "적응형 데이터 분석(Adaptive Data Analysis)"라고 한다. 적응형 데이터 분석으로 도출한 모델은 성능 저하부터 아예 쓸 수 없게 되는 등 다양한 문제가 있다. 그러나 뉴머라이의 경우, 적응형 데이터 분석은 과거 데이터를 과적합 하여 실제로 예측할 때는 성능이 감소할 때 일어난다. 기계 학습 경쟁은 과거 데이터에 기반한 예측률에 따라 승자가 결정되므로 과거 데이터를 과적합할 유인이 있다. 그 결과 의도적으로 과적합을 하게 된다. 뉴머라이에게 꼭 필요한 것은 과거 데이터에만 잘 들어맞는 모델이 아니라 새로운 데이터에서 잘 작동하는 고성능 모델이다. | 이러한 과적합 문제를 "적응형 데이터 분석(Adaptive Data Analysis)"라고 한다. 적응형 데이터 분석으로 도출한 모델은 성능 저하부터 아예 쓸 수 없게 되는 등 다양한 문제가 있다. 그러나 뉴머라이의 경우, 적응형 데이터 분석은 과거 데이터를 과적합 하여 실제로 예측할 때는 성능이 감소할 때 일어난다. 기계 학습 경쟁은 과거 데이터에 기반한 예측률에 따라 승자가 결정되므로 과거 데이터를 과적합할 유인이 있다. 그 결과 의도적으로 과적합을 하게 된다. 뉴머라이에게 꼭 필요한 것은 과거 데이터에만 잘 들어맞는 모델이 아니라 새로운 데이터에서 잘 작동하는 고성능 모델이다. | ||
− | 현재 이러한 제곧된 데이터(holdout)의 재사용(reuse)에 대한 최상(state of the art)의 해결책은 노출 되는 정보량을 제한하는 것이다. 이러한 해결책은 과학적 발견에는 충분할 수 있지만 기계학습 토너먼트에서 순위를 매기거나 사용자들에게 좋은 경험을 제공하는 데 있어서 상당한 걸림돌이 된다. 따라서 뉴머라이 측은 데이터 과학자들이 자신의 모델에 대한 자신감의 정도를 나타낼 수 있는 새로운 시스템을 제안했다. 데이터 과학자들은 새로운 암호화폐인 뉴머레어를 사용하여 자신들의 예측에 대해 배탱함으로 신규 토너먼트에 참여할 수 있다. 이러한 경매 방식은 새로운 데이터에 대핸 모델 성능에 대한 정확한 예측에 대해 보상한다. 데이터 과학자들은 뉴머라이를 통해 자신의 모델의 실제 성능에 대해서 어느 정도 자신감이 있는 지를 나타낼 수 | + | 현재 이러한 제곧된 데이터(holdout)의 재사용(reuse)에 대한 최상(state of the art)의 해결책은 노출 되는 정보량을 제한하는 것이다. 이러한 해결책은 과학적 발견에는 충분할 수 있지만 기계학습 토너먼트에서 순위를 매기거나 사용자들에게 좋은 경험을 제공하는 데 있어서 상당한 걸림돌이 된다. 따라서 뉴머라이 측은 데이터 과학자들이 자신의 모델에 대한 자신감의 정도를 나타낼 수 있는 새로운 시스템을 제안했다. 데이터 과학자들은 새로운 암호화폐인 뉴머레어를 사용하여 자신들의 예측에 대해 배탱함으로 신규 토너먼트에 참여할 수 있다. 이러한 경매 방식은 새로운 데이터에 대핸 모델 성능에 대한 정확한 예측에 대해 보상한다. 데이터 과학자들은 뉴머라이를 통해 자신의 모델의 실제 성능에 대해서 어느 정도 자신감이 있는 지를 나타낼 수 이싿. 그 정도에 대해 표현하면 올바른 모형을 더욱 강조할 수 있어 헤지펀드 자체의 성능 또한 개선할 수 있다. |
− | |||
− | |||
− | |||
− | |||
== 운영 방식 == | == 운영 방식 == |