User-Agent에 크롤링봇인걸 명시하고 크롤링함 애초에 크롤링을 허락하지 않는다고 명시해두면 (해당 내용 적으면 디시 방화벽에서 막음) 긁어오지도 못할건데 뭔 문제임
댓글 11
robots.txt 좆까고 크롤링한 사례 다수 적발되긴 했어
익명(119.202)2024-07-30 12:27:00
답글
ht access나 robots.txt 좆까고 크롤링하면 문제삼을만하지 애초에 크롤링 금지한다고 명시한건데 좆까고 가져온거잖음 그것도 표준인데
가가가가(room1186)2024-07-30 12:28:00
답글
그래서 논란 터지는거잖아 유튜브 자막 털어먹은것도 있는데 그런거 신경쓰면 데이터셋 어케 만들겠노 ㅋㅋㅋ
익명(118.36)2024-07-30 12:29:00
답글
이 정도 인지도의 회사가 그런 짓을 하고도 멀쩡한 건 진짜 AI라는 특수 케이스라 그나마 봐 주는 거에 가까움
익명(119.202)2024-07-30 12:30:00
저작권 알빠 아닌데 좆대로 긁어모으긴함
익명(118.36)2024-07-30 12:27:00
답글
그게 저작권 침해 아님?
익명(121.167)2024-07-30 12:29:00
답글
원래 그런데 여기선 ai학습에 쓰는건 상관없다는 논리라 걍 암말 안함 ㅇ 공정이용이랬나 상업화 한 시점에 의미 있나 싶긴한데
익명(118.36)2024-07-30 12:31:00
그걸 무시하고 하는거에 대해서 말하는거임 ai회사들 대부분 좆까하고 긁어가니까
익명(59.19)2024-07-30 12:29:00
답글
찾아보니까 권고안이네 좆까도 문제없는듯
가가가가(room1186)2024-07-30 12:30:00
답글
ㅇㅇ 규약이라 지킬 필요는 없는데 상식적으로 좀 지켜줘라는건데 그냥 개나소나 무시까고 지들 상업용 ai 학습 데이터에 쓰니까 열뻗치는 애들이 저작권 관련해서 법규가 있어야 한다고 하는거
익명(59.19)2024-07-30 12:33:00
답글
결국은 모든 저작물을 뛰어넘는 결과물이 지속적으로 나올 것이고 일부분의 특성을 지속적으로 이용하게 되는데 그러면 결국은 창작을 하려는 사람이 전부 사라지게 될 것이고 기업이 모든 이익을 갈취하게 될 것인데 (그걸 사람들에게 평등하게 나눠줄거라고 생각하는건 좀...) 그게 옳은건지는 모르겠네
robots.txt 좆까고 크롤링한 사례 다수 적발되긴 했어
ht access나 robots.txt 좆까고 크롤링하면 문제삼을만하지 애초에 크롤링 금지한다고 명시한건데 좆까고 가져온거잖음 그것도 표준인데
그래서 논란 터지는거잖아 유튜브 자막 털어먹은것도 있는데 그런거 신경쓰면 데이터셋 어케 만들겠노 ㅋㅋㅋ
이 정도 인지도의 회사가 그런 짓을 하고도 멀쩡한 건 진짜 AI라는 특수 케이스라 그나마 봐 주는 거에 가까움
저작권 알빠 아닌데 좆대로 긁어모으긴함
그게 저작권 침해 아님?
원래 그런데 여기선 ai학습에 쓰는건 상관없다는 논리라 걍 암말 안함 ㅇ 공정이용이랬나 상업화 한 시점에 의미 있나 싶긴한데
그걸 무시하고 하는거에 대해서 말하는거임 ai회사들 대부분 좆까하고 긁어가니까
찾아보니까 권고안이네 좆까도 문제없는듯
ㅇㅇ 규약이라 지킬 필요는 없는데 상식적으로 좀 지켜줘라는건데 그냥 개나소나 무시까고 지들 상업용 ai 학습 데이터에 쓰니까 열뻗치는 애들이 저작권 관련해서 법규가 있어야 한다고 하는거
결국은 모든 저작물을 뛰어넘는 결과물이 지속적으로 나올 것이고 일부분의 특성을 지속적으로 이용하게 되는데 그러면 결국은 창작을 하려는 사람이 전부 사라지게 될 것이고 기업이 모든 이익을 갈취하게 될 것인데 (그걸 사람들에게 평등하게 나눠줄거라고 생각하는건 좀...) 그게 옳은건지는 모르겠네