내가 알기론 llm은 그냥 학습량 때려박아서 통계적으로 가장 확률 높은 답안 선택하는건데 1+1이 학습데이터에 있다 하더라도 3+3이 학습데이터에 없으면 못 풀어야하는거 아님? 근데 왜케 잘 푸는거야
[일반] 근데 ai가 수학문제를 어떻게 푸는거야
익명(121.128)
2025-06-27 19:46:00
추천 0
댓글 15
다른 게시글
-
벡터나 행렬 쓸 때 볼드체로 하려고 막대 하나 더 쓰잖음
[4][일반] 익명(123.99) | 25.06.27추천 0 -
타오는 해석학이 전공인가요..
[7][일반] 익명(121.184) | 25.06.27추천 0 -
실 복소해석
[9][일반] 익명(121.162) | 25.06.27추천 0 -
공대생인데 오늘부터 복소 공부 시작한다
[일반] 익명(shape7030) | 25.06.27추천 0 -
바이어슈트라스 정도면 수학자 몇티어임?
[7][일반] 탐스런.(tamseurun) | 25.06.27추천 0 -
ai한테 증명 시키니까 중간에 부등호 방향 몰래 바꿔놓네
[7][대학교이상] 익명(203.236) | 25.06.27추천 4 -
증명 선대 배우는 순서/루트 훈수좀
[6][일반] 두터운100k..(dose9112) | 25.06.27추천 0 -
텍으로 이런건 어케 그리는거지
[2][일반] 익명(203.236) | 25.06.27추천 0 -
해석학 처음인데 교재 추천 좀
[9][일반] 익명(211.241) | 25.06.27추천 0 -
선대 솔루션
[일반] 익명(211.198) | 25.06.27추천 0
해당 댓글은 삭제되었습니다.
temperature이 뭐임
그냥 확률 가장 높은거 선택한다는건데 그니까 1+1만 아는 상태에서 3+3이 뭔지 추론할 수 있는 이유가 뭐임
혹시 지능 낮음? 뭐라노 혼자
나도 너와 정확히 똑같은 시각으로 너 보는중임 우연의 일치인가? 신기하노
사람은 어떻게푸는데
아무도 모르지
그 이유를 몰라서 신기해하는중임
근데 또 연구쪽이나 푸트넘 경시쪽으로 가면 ㅈㄴ 실패함 똑같이 학습 데이터에 없는 거라도 깊이에 따라 다른듯
1+1=2 하나만 데이터로 던져주면 3+3을 못 계산하겠지만 1+2=3, 2+2=4, 2+3=5 이런 덧셈식을 많이 던져주면 패턴을 인식해 학습하지 않은 3+3의 값을 '근사'할 수 있음. 이게 왜 가능하냐? 초보적인 예시로 선형회귀가 있음. 데이터가 많이 주어지면 직선을 그어서 중간중간 비는 곳의 값을 추측할 수 있겠음. 이런 측면에서 LLM은 좋은 회귀 계산 프로그램이라고 볼 수 있음
덧셈은 그럼 그렇다쳐도 더 복잡한 개념들은 어떻게 설명함?? 또 근사라기엔 값이 정확하잖아 3+3=6.000000001 이런 느낌으로 나올 수도 있는거고
위에 애가 괜시리 근사라는 말을 꺼내서 오해가 있을 수 있는데 AI가 물론 계산 기능도 있긴 하지만 저런 근사로 저런 문제를 풀진 않음
3+3= 뒤에 6이 나올 확률이 가장 높게 학습되는 거임 - dc App
확률 높은거 선택한다는 소리는 오래전 이야기고 지금은 아무도 모름
dual system theory을 이해하면 알 수 있음. system 1에 해당하는게 딥러닝, 데이터 때려박아서 학습시키면 알아서 패턴 찾아서 답 맞추니까 과정도 설명 못하고 오류도 많음. system 2에 해당하는게 수학 공식, 코드같은 것들. 지금은 system 1에다가 system 2의 도구들을 쥐어준거임. 거기다 reasoning을 통해서 더욱 정교해진거고.