단순히 기존 벤치마크 데이터셋을 샘플링하는 것이 아닌 객관적이고 명확한 평가가 가능한 변별력 있는 데이터셋 개발에 주력합니다 .
dataset
평가 목적에 따른 데이터셋 구축
언어 전문가 그룹으로서 한국어 언어 처리와 이해에 대한 독보적인 역량을 바탕으로 한국어 언어 모델 평가 데이터셋을 구축하여 모델의 성능을 정확하게 평가합니다. 다양한 스펙의 모델을 아우르는 신뢰성과 대표성을 지닌 벤치마크 데이터셋으로 인공지능 산업 및 학계에 기여합니다.
readiness_score
평가 가이드라인 기획
도메인, End-user, 서비스 목적 및 형태 등 다양한 관점에서 모델을 평가하는 지표를 마련합니다. 고객의 니즈와 기호를 구조화하여 단어, 문장, 전체 맥락 단위에서 평가할 수 있도록 세밀하게 설계하며, 직관적인 지표로 평가 후 효율적인 개선 활동이 가능합니다.