Elastic Stack/Logstash
Web crawling
희쨔응
2023. 3. 16. 17:00
현재 테스트 서버에 아래와 같이 개발/테스트 완료 하였습니다.
Naver Open API를 사용하여 네이버 뉴스의 RockPlace 관련 기사를 Logstash로 Web crawling 해준 후 Elastic Index에 적재 합니다 그 후 Kibana 에서 Index pattern을 등록해 주고 대시보드 개발을 통해 Data를 원하는 형식으로 표출 합니다.
Logstash Source
input {
http_poller {
urls => {
naver => {
method => get
url => "https://openapi.naver.com/v1/search/news.json?query=원하는 검색 항목"
headers => {
"X-Naver-Client-Id" => "네이버 오픈 api 계정"
"X-Naver-Client-Secret" => "네이버 오픈 api 패스워드"
}
}
}
request_timeout => 60
schedule => { cron => "* * * * * UTC " }
codec => "json"
metadata_target => "http_poller_metadata"
}
}
output {
elasticsearch {
hosts => ["http://10.65.41.137:9200"]
index => "naver_heejae"
}
}
Elastic Search Index 조회 화면
Kibana 대시보드 화면