영어 중국어에 비해 ㅇㅇ 약간 동음이의어라 해야되나? 그런게 특히 많다보니까. 한자는 같은 음이어도 문자가 다르고 영어도 다른데 한글은 문자도 같으니까 거기서 해석 오류가 발생하는거 같음. 디지털시대 최고 효율 문자가 한글이고 한자는 디지털 시대에 뒤떨어진거라고 국뽕이 한창 있었던거 같은데 시대가 ㅈㄴ 빠르게 변하긴 하는듯.
무조건 데이터, 인구많은 쪽이 유리하지
데이터문제보단 한글 이라는 언어시스템이 ai가 인식하기에 불리해 보이지 않음?
한국인치고는 영어 최상위권이라고 생각하는데 이제 영어 버리고 무조건 한국어로 질문함. 번역이 거의 완벽해지면서 영어 배울 이유가 없어진거같음 영어배울 시간에 걍 자는게 나음
영어 앵간치 하는 사람 시선에서 볼 때 llm들 한영 번역 어떤 것 같음? 진짜로 거의 안어색하고 좋은 수준임?
소설책 번역도 느낌 진짜 잘 살려서 하는 느낌. (젬황 기준)
그것도 잠시뿐임 ai 발전이 조금만 더 진행되면 언어는 아무런 걸림돌이 되지 않을것
그건 LLM벡터임베딩 이전 얘기임 ㅇㅇ 고품질 언어데이터로 다 해결 가능
아직까진 "멍청한 도로롱의 친구 스피키" 라는 문장을 입력했을때 내가 표현하고자 했던건 도로롱이 멍청하다는 거였는데 스피키가 멍청한걸로 해석하는 경우가 종종 있는듯. 또는 그 반대거나 ㅇㅇ
@ㅇㅇ2(59.11) 그거는 텍스트에 억양을 담는 게 아닌 이상 사람도 헷갈리는 거라 별 수 없지 않아?
맞춤법,오타,띄어쓰기,주어나 목적어 실종,문법파괴,손투리 같은 걸 줄여나가도록 노력할 필요가 있음 다문화,외국인들 늘면서 더 심각해짐 - dc App
한국어는 llm 토큰 측면에서 불리하지 영어보다 토큰을 더 처먹으니깐