마이크로소프트, ML.NET 2.0 배포...텍스트 분류 기능 강화

최정인 / 2022-11-29 09:47:00

해외 IT 매체 인포월드가 마이크로소프트의 오픈소스 크로스 플랫폼 머신러닝 .NET 프레임워크 인 ML.NET 2.0 배포 소식을 보도했다. ML.NET 2.0은 텍스트 분류와 자동 머신러닝 기능을 개선했다.

ML.NET 2.0은 11월 10일 자로 ML.NET 모델 작성기(ML.NET Model Builder)의 신규 버전과 함께 공개됐다. ML.NET 모델 작성기는 머신러닝 모델을 구축하는 시각적 개발 도구이다. 모델 작성기의 텍스트 분류 시나리오는 ML.NET 텍스트 분류 응용 프로그램 인터페이스(ML.NET Text Classification API)를 기반으로 한다.

지난 6월 자로 프리뷰 과정을 거친 텍스트 분류 API(Text Classification API)는 개발자가 원시 텍스트 데이터를 분류하기 위한 사용자 지정 모델을 학습하는 기능을 지원한다. 텍스트 분류 API는 마이크로소프트 리서치(Microsoft Research)가 개발한 사전 학습 토치샤프 NAS-BERT 모델(TorchSharp NAS-BERT model)과 개발자가 소유한 자료를 이용해 모델을 미세 조정한다. 모델 작성기 시나리오는 중앙처리장치(CPU)나 쿠다(CUDA) 호환 그래픽 처리 장치(GPU)에서 로컬 학습을 지원한다.

이진 분류(binary classification), 다중 분류(multiclass classification)와 회귀 모델 학습에서 사전 학습된 자동 기계학습 파이프라인을 이용할 수 있어, 머신러닝을 더욱 쉽게 시작할 수 있다.

오토ML 피처라이저(AutoML Featurizer)를 이용해 데이터 전처리 과정 자동화도 지원한다. 아울러, 개발자는 학습 과정에서 사용할 트레이너를 선택할 수 있다. 최적 하이퍼 매개 변수를 찾는 데 사용할 조정 알고리즘도 선택할 수 있다.

고급 자동 오토ML 훈련 옵션도 추가돼, 트레이너와 최적화용 평가 지표도 선택할 수 있다. 또한, 토치샤프 NAS-BERT 모델을 기반으로 하는 문장 유사도 API는 두 개 어구의 유사도를 대변하는 값을 산출한다.

이 밖에 ML.NET 개발진은 앞으로 딥러닝 기능을 강화하고 회귀나 분류 등 기존 머신러닝 작업에 LightGBM 프레임워크 사용을 확대할 예정이라고 밝혔다. 개발진은 오토ML API 개선에도 참여하여 새로운 시나리오와 사용자 정의를 지원하고 머신러닝 작업 흐름을 단순화한다.

[ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최정인

IT/Tech, 금융, 산업, 정치, 생활문화, 부동산, 모빌리티

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0