일상 Domain본 용역은 대화설계부터 코퍼스 구축까지 턴키(turn-key) 방식으로 수주한 용역입니다.감성대화의 효과를 정의하고 이를 극대화할 수 있는 시나리오 설계와 태그셋 구축 및 발화문 생성이 과제의 핵심이었습니다. 👉 프로젝트 개요 프로젝트명: 청소년 고민상담 멀티턴 대화 자유발화 멀티턴 대화에 관한 설계 및 학습 코퍼스 구축 고객: IT/미디어 대기업 기간/규모: 6개월, 대화설계 및 30만 발화문 구축 목적: 사용자의 고민을 나누고 긍정적인 심리적 변화를 꾀할 수 있는 챗봇의 구현 자유발화 대화셋과 위 목적과의 비교 분석을 통한 실증 테스트 [표 2] 감성대화 챗봇 프로젝트 상세 1. 대화 목적과 형식의 설정 고민상담에 적합한 챗봇 persona의 정의 사용자의 이용 맥락을 고려한 주제 세분화 대화 흐름의 적절한 통제할 수 있는 대화 목적의 부여 "성향유형검사", "선호 캐릭터/연예인 정보" 등을 분석한 적정 persona를 도출 총 70개의 주제 세분화 작업을 진행(고민상담37개, 일상대화 33개) 대화의 시작과 끝을 명확히 규명하고 총 12턴의 발화턴으로 구성하여 구조적인 안정성 확보 대화set별로 행동유도, 지지공감, 다음대화유도의 3가지 목적을 부여2. 시나리오 설계 실제 대화양상을 반영한 시나리오 구축 풍부한 발화 체계를 위한 세분화된Tag-set의 도출 Tag-set간의 조합을 통한 대화 패턴의 완성 대화 몰입감 증대를 위한 장치 마련 상담심리학과 국문학 전공자의 협업에 바탕 총 5단계 시나리오 및 70개 분류 체계(Tag-set) 구축(시나리오(3)→시나리소분류(4)→화행(19→화행소분류(44)) 탐색-구체화-마무리를 대표 패턴으로 하되, 맞장구 등의 장치를 통해 단조로운 패턴을 지양 각 시나리오 단계에 맞는 적절한 질문의 배치(대화 과정에서 고민의 핵심에 다가갈 수 있는 질문지 구축)3. 챗봇 persona에 맞는 문체의 정의와 가이드라인 설계 사용자 특징과 이용 환경을 고려한 발화 양성 규명 청소년 문체의 특징 규명(실제 청소년을 대상으로 한 User-test 진행, 관련 연구자료 참조) 모바일 환경에서의 문체 특징 규명(문장길이/분할 양상, 오탈자 형태, 자주 사용하는 어휘 등) 다양한 표현형 어휘들을 수집하여 활용(감정용어 260개, 자모자/축약/이모지 569개 등)4. 코퍼스 구축 가이드라인을 빠르고 정확하게 반영할 수 있는 교육과 검수 작업의 조기 안정화를 위해 온오프라인 작업 병행 고민상담 멀티턴대화 코퍼스 16만, 자유발화 멀티턴대화 코퍼스 4만 생성