
4차 산업혁명과 자동화, 디지털 혁신 흐름이 이어지면서 인공지능(AI)이 필수가 되었다. 그와 덩달아 AI 개발 작업을 하고자 하는 개발자도 증가했다. AI 개발 작업 시 많은 개발자가 깃허브(GitHub)를 활용한다. 깃허브는 다양한 도메인에서 수백만 개의 저장소를 보유했으며, AI 저장소 종류도 다양하다.
그렇다면, AI 개발자가 활용하기 좋은 저장소는 무엇일까? 인도 IT 전문 잡지 애널리틱스 인사이트가 AI 개발에 활용하기 좋은 최고의 저장소를 아래와 같이 소개했다.
1. 텐서플로
텐서플로(TensorFlow)는 머신러닝과 AI를 위한 오픈소스 프레임워크로 널리 인정받고 있다. 이 깃허브 저장소는 구글 브레인팀이 개발한 것으로 다양한 학습 자료를 담고 있다. 컴퓨터 비전, 자연어 처리(NLP) 및 추천 시스템을 위한 최신 모델을 사용하면 데이터 세트에서 매우 정확한 결과를 생성할 수 있다.
2 AdaNet
AdaNet은 최소한의 전문가 간섭으로 고품질 모델을 자동으로 학습하는 데 사용하기 좋은 텐서플로 기반 저장소이다. 깃허브에 있는 AI 저장소 중 하나인 AdaNet은 쉬운 사용성, 유연성, 속도 및 학습 보장을 자랑한다.
3. BERT
BERT는 사전 훈련 자연어 처리를 위한 최초의 비지도 심층 양방향 시스템이다. 수많은 자연어 처리 작업에 대한 새로운 최첨단 결과를 얻기 위해 텐서플로 코드와 BERT를 위한 사전 훈련된 모델을 포함한다.
4. 에어플로우
에어플로우(Airflow)는 주로 데이터 처리에 중점을 두고 있다. 하지만 에어플로우는 작업을 매우 중시한다는 점에 주목할 가치가 있다. 즉, 작업 결과는 동일하며 대상 시스템에서 중복 데이터를 생성하지 않는다는 의미이다.
5. 다큐먼트 시밀리리티
다큐먼트 시밀러리티(Document Similarity)는 문서 유사성을 분명히 강조하는 초급 수준의 AI 깃허브 저장소이다. 문서 유사성 애플리케이션의 기본 개념은 문서 간에 논의되는 공통 주제를 찾는 것이다.
6. AI 러닝
AI 러닝은 머신러닝, 딥러닝, 자연어 처리 등 다양한 레슨으로 구성되었다. AI 깃허브 저장소에 가장 널리 의존하는 저장소 중 하나이다.
7. 알고리즘
알고리즘(THE ALGORITHMS) 저장소는 파이썬에서 독점적으로 코딩된 다양한 알고리즘을 포함하는 배타적 머신러닝 하위 저장소이다. 여기서는 선형 및 다항식 회귀 분석과 같은 여러 회귀 분석 기법에 대한 코드를 얻을 수 있다. 연속 데이터에 대한 예측적 분석에서 응용 가치가 매우 뛰어나다.
8. 사이킷런
사이킷런(Scikit-learn)은 분류와 회귀 및 클러스터링 알고리즘은 물론이고, 데이터 준비 및 모델 평가 도구를 포함하고 있어 전 세계적으로 널리 알려져 있다.
9. 어썸 머신러닝
어썸 머신러닝(Awesome machine learning)에는 사용 가능한 거의 모든 언어에서 사용할 수 있도록 정리된 머신러닝 라이브러리, 프레임워크 및 도구 목록이 있다. 대체로, 머신러닝을 위한 집단 개발 환경을 촉진한다.
10. 스페이시
스페이시(spaCy)는 파이썬의 고급 자연 언어 처리를 위한 라이브러리다. 스페이시는 매우 최신 연구를 기반으로 구축된 하나의 저장소이며, 처음부터 실제 제품에 사용될 수 있도록 설계되었다.
[ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]