In an effort to peel back the layers of the LLM, OpenAI is developing a tool that automatically identifies which parts of the LLM are responsible for which behaviors. The engineers behind the tool emphasize that it's still in its early stages, but the code to run the tool is already openly available on GitHub. "We want to be able to trust what our models do and the answers they produce," OpenAI said.
OpenAI가 LLM의 레이어를 벗겨내기 위한 노력의 일환으로 LLM의 어느 부분이 어떤 동작에 책임이 있는지 자동으로 식별하는 도구를 개발하고 있는 것으로 나타났다. 해당 툴을 개발한 엔지니어들은 아직 초기 단계라고 강조했지만, 이미 오픈소스를 통해 이 툴을 실행할 수 있는 코드가 깃허브에 공개됐다. 이에 OpenAI는 "우리는 모델이 하는 일과 그 모델이 만들어내는 답을 신뢰할 수 있기를 원한다"라고 밝혔다.
소셜댓글