본문 바로가기
카테고리 없음

GPT4o의 놀라운 이미지 인식 성능 후기

by 컴백과 2024. 5. 16.
728x90
반응형

오늘도 하루 종일 GPT4o의 성능을 테스트 해보느라 시간이 가는줄 몰랐습니다. 어제는 나온지 얼마 되지 않아 텍스트 위주로 테스트를 해보았는데 이번에는 이미지 인식에 대해 소개해 드리겠습니다.

 

제가 주로 쓰는 단축키를 이미지로 만들어두고 포스팅 할 때 여러번 사용했었는데요. 그 이미지를 AI가 어떻게 인식하는지 한 번 테스트 해보았습니다.

 

GPT4o 이미지 인식 테스트

 

 

완벽하지는 않지만 해당 이미지가 키보드라는 것을 인식했습니다.

R키는 인지 하였지만 윈도우키는 인지 하지 못하였네요. 

 

 

GPT4 이미지 인식 테스트

 

같은 그림을 GPT4에게 물어 보았습니다.

 

GPT4는 안의 도형과 R이라는 글자는 인식 했지만 이것이 키보드의 키라는 것은 인지하지 못하였습니다.

 

 

이미지 업로드를 통한 OCR 성능

 

 

제 블로그 제목을 캡쳐해서 올려 보았더니 정확히 글자를 추출해 냈습니다.

 

반면, GPT4는 엉뚱한 대답을 내놓았습니다.

 

 


이미지 속의 상황 인지

 

  • 프린터 고장
  • 여성
  • 당황하거나 화난 모습
  • 출력된 종이
  • 매우 불쾌하고 놀란 상태
  • 커피잔과 노트북 또는 메모장

위와 같이 완벽하게 사진을 해석해 낸 모습입니다. 정말 놀랍습니다.

 

이미지 생성 능력

 

이번에는 위 이미지를 보고 남성으로 바꿔서 만들어줘. 라고 해보았습니다.

 

 

  • 프린터 고장
  • 노트북 및 메모장
  • 커피잔
  • 당황한 모습
  • 남성

이번에도 완벽하게 해낸 모습입니다.

이젠 어떤 것도 가능할지 더 궁금해 집니다. 계속 테스트 해보아야겠습니다.

오늘도 읽어 주신 분들께 감사드립니다. ^^

 

728x90
반응형