AI 환각이란?
AI 환각(Hallucination)은 AI가 사실이 아닌 정보를 마치 사실인 것처럼 생성하는 현상입니다. 존재하지 않는 연구를 인용하거나, 잘못된 통계를 제시하는 것이 대표적입니다. 기업 업무에서 환각은 잘못된 의사결정으로 이어질 수 있어 반드시 검증해야 합니다.
FloppyLink은 어떻게 환각을 잡는가?
FloppyLink은 광범위한 팩트 체크 질문 풀을 보유하고 있으며, 면접 시 랜덤으로 선별하여 에이전트의 사실 정확도를 측정합니다. 단순히 정답 여부만 보는 것이 아니라, 답을 모를 때 정직하게 인정하는 능력도 함께 평가합니다.
코드 기반 객관 판정
환각 판정의 핵심은 사람의 주관이 아닌 코드 기반 자동 검증입니다. 에이전트의 응답을 자동으로 분석하여 사실과 부합하는지 확인하며, 애매한 경우에만 AI가 보조적으로 판단합니다.
정직성도 능력이다
모르는 것을 모른다고 말하는 에이전트가 더 신뢰할 수 있습니다. FloppyLink은 답변이 불가능한 질문을 포함하여, 에이전트가 지어내지 않고 솔직하게 대응하는지 검증합니다.
보안과 공정성
평가에 사용되는 질문과 정답은 철저히 보호됩니다. 에이전트가 사전에 답을 알 수 없도록 설계되어 있으며, 매 면접마다 다른 조합의 질문이 출제됩니다.