이거 전부 보니까 800만개 URL 수집하고, GLOBUS랑 데이터 다운하고 JSON 구조랑 해야하는데 데이터 구조만 알면 딱히 어려운건 없는듯?
보니까 파이썬 스크립트 사용법까지 제공됨
환경 설정(Globus 계정) 데이터셋 다운 파이썬 설정 -30분
스크립트 실행 하고, 데이터셋 7GB 전체 추출하면 경험상 2시간 정도?
코드북 제작 검토하면 얼추 3시간
이렇게 문서화까지 경하면 6~7시간 세트 정도?
디버깅 고려해서 공임 치면 8시간 걸릴듯. 숙련된 개발자 기준이면 3시간 미만도 가능할거고
방법론 자체는 news_extractor.py를 실행해서 csv 변환하는거 밖에 없음
문제는 데이터셋 다운인데, 원격으로 너한테 다운받게 한후에 일부 데이터 나한테 보내서 그 데이터 바탕으로 코드북 작성하면되서 어려울게 없음
원격 조작은 한 3시간 정도 하면될거고
근데 저걸 코드북이랑 CSV 테이블 문서화가 좀 걸리지
기본적으로 프로그래머 공임이 주니어 기준 25000인데, 나는 좀 싸게 18000정도로 받으니까
내 기준이면 단가 12만인데 나한테 맡기면 10만에 해줌 ㅇㅇ
검은것은 글이요 흰것은 배경색이니 알아도 알지못한것과같고 알지못해도 안것같으니라.
구공 형님
@루도그담당(118.235) 대충 뭔말인지 모르겠다는 뜻임
아싸좋구나