프로그래밍 하는 사람은 아니고 회사에서 데이터 수집 할 일이 생겨서 ai로 이것저것 시도해보는 중인데요
지금 하고자 하는게
네이버or구글에서 기업 검색, 기업 홈페이지 진입, 홈페이지 하단부 혹은 contact 페이지 같은곳에 있는 전화번호, 팩스, 이메일 등 수집
이건데, 코드 돌려보면 기업 검색은 하는거 같은데 안에 내용을 전혀 못가져오는거 같습니다.
혹시 구조적으로 불가능한 일 일까요?
프로그래밍 하는 사람은 아니고 회사에서 데이터 수집 할 일이 생겨서 ai로 이것저것 시도해보는 중인데요
지금 하고자 하는게
네이버or구글에서 기업 검색, 기업 홈페이지 진입, 홈페이지 하단부 혹은 contact 페이지 같은곳에 있는 전화번호, 팩스, 이메일 등 수집
이건데, 코드 돌려보면 기업 검색은 하는거 같은데 안에 내용을 전혀 못가져오는거 같습니다.
혹시 구조적으로 불가능한 일 일까요?
가능합니다
넵 노력해보겠습니다 ㅠ
크롤링 배워봤다면 알겠지만 html의 특정 구조를 가져오는 방식(물론 그 외 방식도 있음.)이잖아 그런데 각 홈페이지 마다 html 구조가 다 다를테니 다르게 접근을 해야겠지? 나 같은 경우 html의 text를 전부 다 가져와서 거기서 정규식으로 찾아내곤 했어.