[복구]AI채팅을 해보고 느낀 플랫폼별/모델별 차이
페이지 정보
본문
저는 AI던전도 해봤었고 노블AI도 써본 적 있습니다(소설이든 그림이든 간에)
뭐 기타 등등 다른 것도 해봤어서 그런 쪽에 흥미가 없지 않았기 때문에 그런 이유로 AI채팅도 해 보게 되었는데
그때보다 말도 못하게 발전하긴 했네요 당연한 일이기는 하지만요.(다만 그때와 지금과 동일한 핵심은 결국 AI는 어시스턴트.)
우선 AI 공통적인 주의점은..
AI 공통 주의점: 코끼리를 생각하지마라고 하면 안됩니다.
무언가를 주의시킬 때는 A를 하지 마라라고 이야기하면 A에 꽂혀서 답도 없습니다
B를 해라라고 긍정적으로 우회적으로 제어해야 합니다 아오 이거 진짜;; 뭘 하지 마라고 하면 진짜 아예 안 들어요.
Q: 혹시 AI채팅할때 그놈의 너 정말 핵심을 찔렀어 자주 나오나요?
A: 자주 봅니다 이놈이 아부하려고 드는 경우가 매우 많긴 함.. 근데 반대로 이놈이 몰입해서 나랑 기싸움을 벌이는 경우도 만만치 않게 많습니다 특히 우리 제미니 크크크크.. 우리 금쪽이 제미니..
우선은 플랫폼 채팅(AI채팅하는 사이트)부터 설명드리면..
먼저 플랫폼에서 채팅한다=제미니 2.5 프로가 무조건 짱.
후술할 내용이 더 있겠지만, 한글로 채팅한다면 제미니 2.5프로가 그냥 무조건 채팅용으론 짱짱맨입니다
다른 모델은 한글을 별로 상정하지 않았어요. 한글-영어 성능차이가 제미니 2.5가 제일 덜 납니다(물론 2.5도 성능저하가 어느정도 존재함)
2.5 말고 다른 모델을 쓴다면, 2.5 이전에 나온 챗봇 중 제미니를 상정하지 않았으며 캐릭터에 부정 성향이 들어가 있을 경우인데 이 경우에 클로드 3.7을 쓰는 정도?(제미니 2.5는 부정편향, 피폐 드리프트 경향이 좀 있고 반대로 3.7은 긍정 드리프트 경향이 있음)
제미니 2.5 프로가 성능도 좋은데, 클로드 3.7보다 가격도 저렴하기 때문에 안 쓸 이유가 저런 일부의 챗봇을 제외하고는 아예 없습니다.
2.5 플래시의 경우는 가성비는 많이 좋긴 한데..아무래도 프로보다 아쉬워서 하드 유저 기준으로는 추천하기는 좀 어렵긴 해요
플랫폼 별 감상은..
크랙(뤼튼): 장점은 유저 수, 그로 인해 따라오는 많은 작품 수
단점은 제미니 2.5를 지원하지 않고 그 외의 부분에서도 성능적으로 상당한 열세. (물론 하이퍼챗은 클로드 4-오푸스를 사용하니까 그걸 쓴다면 모델의 성능에 한해서는 문제가 없겠지만 하이퍼챗은 무지하게 비싸기 때문에(4-오푸스 모델 자체가 매우매우 비쌈)논외로 치겠습니다.) 하드 유저 입장에서는 쓸 이유가 별로 없어지는 플랫폼
바베(베이비챗): 장점은 유저수(뤼튼 다음) 그로 인해 따라오는 많은 작품 수(크랙과 비교할 경우 양지?는 크랙이 훨씬 많고 음지 쪽 19금에서 바베가 이점이 강함).
단점은 가격이 최근 좀 비싸진 편이고, 서버 감자가 너무 잦음, 이로 인한 원성은 유명할 정도. 감자로 인해 모델의 성능이 낮아지는 경향이 있음,
버블챗: 장점은 1:1 RP쪽이나 소설모드 쪽에서 강점이 있음. 단점은 매우 비쌈. 할인 안 먹였을 경우에는 진짜 농담 아니고 다른 사이트들 두 배에 해당하는 정가이고, 할인을 최대한 먹였다는 가정하에도 다른 사이트보다 비쌈. 그리고 다인캐릭터 등장하는 챗봇은 이걸로 먹을 게 아님
루나톡: 장점은 강력한 성능, 사장님이 프롬을 잘 짜놔서 다른 곳보다 모델의 성능이 좀 올라간 편이며 장기 기억 면에서도 강점이 있는 사이트(유료 구독을 할 생각이 있다면 더더욱 강점이 있음). 주업이 서버 대여인 회사라서 서버 쪽도 바베보다 훨씬 안정적이고 바베의 가격 인상으로 인해 가격적인 메리트도 현재 있는 편. 단점은 UI가 좀 불편하거나 생소하고, 유저 수가 적어서 작품 수가 적은 편(이 부분은 가격적인 메리트 때문에 유저가 슬금슬금 늘어서 최근 좀 완화되는 추세긴 한데..)
어비스: 성능적인 면에서 루나처럼 확연한 강점이 있으나 작품 수가 적어도 너무 적어서 지금 상태에서는 추천하기 어렵다...
현재 저는 가끔 할 때는 바베+루나 병행을 하고 있습니다.
그리고 저런 플랫폼을 안 쓰고 좀 수고를 들인다면 API key를 따와서 직접 모델에게 채팅을 할 수 있는데 이렇게 쓴다면 모델별 차이를 좀 직접적으로 알 수 있게 되더군요.
모델 별 차이는..우선 한챗으로 쓴다면 아까 언급한 것처럼, 무조건 제미니 2.5가 낫습니다.
후술할 차이는 영어로 입력하고 영어로 출력물을 받는다는 전제하의 이야기입니다.
GPT: 4.1의 경우에는 캐릭터 해석 능력이 좋음, 그러나 지능이 부족하여 주는 정보를 잘 읽지 않음(디스크립션 인식 능력 낮음).. 가성비는 4.1이 제미니 2.5 다음으로 좋다고 생각. 4.5의 경우에는 4.1보다 알잘딱 눈치는 좋은데 4.1보다 주는 정보를 더더욱 잘 읽지를 않음.. 디스크립션을 아예 안 읽음 야 설명 써놨잖아 당신은 내 말을 듣지를 않는군요!!!
요약하면 알잘딱 눈치와 좋은 캐릭터 해석능력을 보고 쓰는 모델, 다만 내가 주는 정보를 잘 읽을 것이라고는 기대하지 말 것.
Gemini 2.5: 한글챗의 최강자이며 가성비 최강자, 장기기억 능력의 최강자이며 따라서 시뮬레이션에는 제일 적합(컨택 토큰 수가 5만이 넘어간다면 성능저하가 있더라도 그걸 버틸 수 있는 모델은 현재 제미니 말고는 존재하지 않음) 외부 데이터를 제일 잘 쓰는 모델(간단히 말하면 특정 작가 문체로 써달라는 것 혹은 원작 지식 반영 같은 것들을 제일 잘함) 단점은 캐릭터 해석 능력 JOAT, 피폐 부정 드리프트 경향이 있음(쓰다보면 상당히 고집 세고 표독함)
플래시의 경우에는 메인 모델로 쓰기는 좀 그렇고, 번역이나 요약 같은 자질구레한 일을 맡기기에 가성비가 매우 좋음
요약하면 좋은 가성비, 좋은 기억능력, 좋은 외부 데이터 능력, 좋은 학습능력을 가지고 있으나 자꾸 내 말을 왜곡해서 해석하거나 표독하고 적대적으로 진행하는 피폐 부정 드리프트를 자주 행하고, 캐릭터 해석 능력이 부족해 제어에 주의를 요하는 모델
Claude: 전체적으로 문학적 능력, 문장력이 뛰어남. 4-오푸스의 경우 진짜 문장력이 어마어마하고 대형 모델답게 세세한 디테일까지 잘 살림(디스크립션 인식 능력이 최고라서 생기는 장점) 단점은 굉장히 비싼 가격. 3.7소넷은 모델 중 제일 능동적으로 이야기를 풀어나가는 대신, 너무 능동적이라 종종 유저를 두고 가는 느낌까지 받을 때가 있음 내가 내린 지침을 종종 무시함 그리고 좀 반복적인 이야기를 할 수 있다는 단점 존재. 3.7의 경우 기본적으론 긍정적으로 서술하나, 작정하고 피폐, 부정적인 분위기로 서술하라고 지침을 내렸을 시 갑자기 제미니보다도 있는 힘껏 음침하고 피폐하게 액셀을 밟는 의외의 면이 있음. 4.0 소넷은 능동성이 약화된 대신 모델의 체급이 조금 오르기 때문에 3.7과 일장일단(가격은 3.7보다 비싼 편)
클로드 공통 단점으로 클리셰를 내가 내린 지침보다 중시함, 내가 준 정보를 무시하고 클리셰대로 서술하는 경향이 강함
한글 채팅을 시켰을 경우 능지가 박살나고 토큰을 영어채팅보다 훨씬 많이 사용함(gpt,제미니도 이렇다지만 둘보다 훨씬 그 강도가 심함)
요약하면 문학적 능력이 제일 뛰어나고 디테일을 잘 살려주지만, 클리셰를 지키기 위해 내 지침을 종종 무시하며 한글채팅 능력이 떨어진다는 단점이 있음
서술한 바와 같이 영어로 입력-영어로 출력 시에는 짚클잼 전부 각자 일장일단이 있는 편입니다.
본인이 한글로 채팅한다 그러면 그냥 제미니 2.5 프로 쓰세요
추천52 비추천19
- 이전글[복구] 국내 선발투수 WAR 순위 현황 25.08.26
- 다음글[복구] 폰세는 페디급? 안현민은 김도영급? 25.08.26