#쇼핑몰#웹크롤링#보이스피싱예방#넷플릭스#피싱스톱#넷플릭스트렌드

구독자님들, 안녕하세요! 스파이더킴의 데이터 뉴스레터 디귿입니다😊
이번 주차에는 웹크롤링으로 온라인 쇼핑몰 Q&A 분석하기, 후후와 IBK 기업은행의 보이스피싱 예방을 위한 협력 소식과 데이터 분석으로 넷플릭스 트렌드 알아보는 방법을 가져왔어요❗
유익한 정보가 가득한 이번 주의 뉴스레터! 재밌게 읽어보시고, 행복으로 가득한 한 주가 되시길 바랄게요💕
'디귿'은 가장 쉬운 웹크롤링 서비스, 스파이더킴에서 발행하는 뉴스레터💌입니다.
스파이더킴에 방문하셔서 무료로 웹크롤링 서비스✨를 이용해보세요.
이번주에 디귿이 준비한 내용
  1.   [웹크롤링하는 한과장] 웹크롤링으로 온라인 쇼핑몰 Q&A 분석을
  2.   짜증나는 대출권고 전화, 후후와 IBK 기업은행이 철벽방어!
  3.   [데이터 분석] 요즘 핫한 넷플릭스 영화/TV쇼 트렌드는? 
1. [웹크롤링하는 한과장] 웹크롤링으로 온라인 쇼핑몰🛒 Q&A 분석을

요즘 온라인 쇼핑몰 자주 사용하시는 구독자님들 많으시죠? 쇼핑할 때 가장 고민되는 부분이 제품의 실사를 보기 어렵고 장단점을 알 수 없다는 것인데요😥 오늘은 이 문제점을 단번에 해결할 수 있는 온라인 쇼핑몰 Q&A 키워드 분류 작업에 대해 알려드릴게요!

특히 인테리어 및 소품에 관해서는 수많은 문의사항이 있는데요. 아무래도 사이즈와 실제 모양이 중요한 제품들이기 때문입니다. 이 때문에 온라인 쇼핑몰에서 문의사항을 효율적으로 관리하기 위해 태그(Tag)를 통해 분류를 하는데요.

“각 제목과 내용은 어떤 키워드로 분류되고 있을까요?”
Q&A 섹션의 질문과 키워드 태그를 크롤링하여 각 제목과 내용에는 어떤 키워드가 적용되었는지 알아봅시다. 

화면 옆에 웹 크롤링을 위한 툴바(Tool bar)를 활용하여 '시작 페이지' 정보를 추출해볼게요.
추출하고자 하는 정보는 별점리뷰 !!

원하는 항목을 클릭클릭~!👈

오늘도 몇번의 클릭으로 추출 완료✌

짠! 이렇게 원하는 정보를 몇 번의 클릭으로 추출해보았어요. 제목, 내용, 키워드까지 하나의 파일로 깔끔하게 정리되었습니다.

그리고 형태소 분석을 통해 태그별로 다시 분류해봤어요. 분석 방법이 궁금하신 분들은 여기를 클릭해서 확인해주세요!😉

웹크롤링 한과장 콘텐츠 잘 보셨나요? 한과장처럼 온라인 쇼핑몰 크롤링을 해보고 싶다면? 아래 버튼을 클릭해 무료로 시작해보세요👇👇
2. 짜증나는 대출권고 전화, 후후와 IBK 기업은행이 철벽방어한다!🛡

"
안녕하십니까 고객님, 00캐피탈입니다. 3%의 최저금리로
 최대 2000만원까지 대출 가능하신데
"

이제는 이 멘트만 봐도 짜증이 치밀어 오르는 거, 구독자분들도 많이 공감하시죠? 내 번호가 도대체 어디까지 유출되서 매일매일 이런 전화가 오는건지! 😡 하지만 이제 이 짜증을 덜어낼 수 있습니다. IBK기업은행과 후후앤컴퍼니의 착한 만남! 무엇인지 알아보시죠!
후후앤컴퍼니, IBK 기업은행과 보이스피싱 탐지 데이터 공유
스팸 차단 앱 후후를 운영하는 후후앤컴퍼니가 보이스피싱 사전 예방과 국민 피해 방지를 위해 IBK기업은행과 보이스피싱 탐지 데이터를 공유하기로 했습니다. 후후 스팸 통계에 따르면 금융기관을 사칭하는 수법으로 대출 권유를 하는 스팸이 증가📈하는 추세를 보이고 있는데요. 이에 따른 피해를 예방하기 위해선 이용자 스스로 조심하는 것은 물론, 관계 기관이 금융과 통신 데이터를 활용해 이상 징후를 빠르게 파악하는 것이 중요합니다

신속한 보이스피싱 대응을 위해 후후앤컴퍼니는 통화 중 이상 징후 탐지 데이터를 IBK 기업은행의 전기통신금융사기 AI-모니터링 시스템과 공유하기로 했습니다. 이 시스템은 금융거래 시 사기 등 위험한 상황을 파악해 해당 거래를 사전에 차단하여 보이스피싱 피해를 예방하는 기술이에요
데이터 협력, 구체적인 방식은?
후후 앱은 성문 분석, 위험 평가 모델 데이터베이스(DB) 등 자체 보유한 보이스피싱 탐지 솔루션으로 이용자의 위험을 탐지해 해당 정보를 IBK기업은행의 모니터링시스템👨‍💻과 즉각 공유하는데요. 이후 담당 직원이 고객의 거래를 모니터링 한 뒤 평소와 다른 패턴의 거래를 사전에 차단함으로써 금융 사기 피해를 예방하는 방식입니다.

IBK
기업은행은 정교한 알고리즘으로 날마다 생성되는 수많은 금융 데이터 중 보이스피싱 사기로 의심되는 거래를 차단해 피해를 예방하고 있다. 이번 후후앤컴퍼니와의 협력으로 보이스피싱 예방을 위해 기존 금융 데이터와 더불어 통신 데이터를 활용할 수 있게 되어, 더 강력해진 고객 보호 장벽을 세울 수 있게 되었습니다.🙅‍♂️

보이스피싱 예방앱 피싱스톱

보이스피싱 예방을 위한 후후앤컴퍼니와 IBK기업은행의 협력은 이번이 처음이 아닌데요. 2019 IBK기업은행은 자체 개발한 인공지능(AI) 보이스피싱 탐지 서비스 '피싱스탑'을 후후앤컴퍼니의 '후후'에 탑재해 이용자들에게 시범 운영한 바 있습니다. 더욱 정교화된 피싱스탑서비스는 곧 정규출시를 앞두고 있다고 하니 구독자 여러분들도 이용해보세요!😉
3. [데이터 분석] 요즘 핫한 넷플릭스 영화/TV쇼 트렌드는? 

서론
세계 최대 비디오 스트리밍 서비스 기업, 넷플릭스! 다들 이용하고 계시죠?😁 넷플릭스는 2019년 당시 7,787개 이상의 콘텐츠를 보유하고 있으며 전세계 1억 3천 5백만 명의 유료 고객들과 계약을 맺었다고 발표한 바 있는데요😮 많은 사람들이 넷플릭스를 이용하고 있는 만큼, 수 년간의 넷플릭스 트렌드를 파악하는 것은 곧 현대인들의 트렌드를 파악할 수 있는 방법이라 여겨집니다. 그래서 이번에는 넷플릭스 영화와 TV 쇼 타이틀의 데이터 세트를 분석해 몇 년 동안 어떤 경향이 있었는지 알아보려 합니다! 이 글을 통해 넷플릭스가 어떠한 방식으로 빅데이터를 수집, 분석하고 사용자 기반 서비스를 확장해왔는지 알 수 있을 거예요😊


"데이터로 요즘 넷플릭스 트렌드 알아보자👀"

데이터 세트
데이터세트는 데이터 분석 플랫폼인 kaggle에서 획득했고, 추가적으로 다양한 변수를 포함했는데요! 영화 및 TV 프로그램의 제목과 함께 감독, 출연진, 날짜, 개봉 연도, 설명, 기간 등을 추가했습니다. 이러한 변수를 사용하여 보다 다양하게 관찰하고 시각화 결과를 만들 수 있었습니다.
분석

이 차트를 보면 영화 제목 수가 TV쇼보다 더 많은 것을 알 수 있습니다. 하지만 2020년이 다가오면서, 영화 개수는 떨어지고 TV쇼가 증가합니다. 왜 그럴까요?
유력한 원인 중 하나는 바로 코로나19의 유행입니다. 코로나19의 유행으로 인해 영화산업이 축소된 것이죠. 또 동시에 넷플릭스 오리지널 시리즈는 흥행하면서 TV쇼는 확대된 것으로 분석해볼 수 있어요.

이 두 차트는 2010년부터 2020년까지 매달 추가된 콘텐츠 수와 월 평균 타이틀 수를 보여줍니다! 보시다시피, 2월에 추가된 콘텐츠의 양이 제일 적으며, 10월이 가장 많네요.

이 box plot에서는 상위 11개국의 넷플릭스 영화 상영시간을 볼 수 있습니다. 주목할 만한 것은 2001년 119분에서 2020년 90분으로 수 년동안 평균 상영시간이 감소했다는 것입니다📉

이 차트에서는 등급별 영화/TV쇼 제목 수와 출연진의 반복 횟수를 볼 수 있어요! R등급의 영화와 발리우드 배우들이 많이 나타나고 있는 것을 볼 수 있네요. 

넷플릭스 제목에서 가장 많이 나타난 단어들을 워드클라우드로 만들어보면 다음과 같습니다. 사랑💕과 크리스마스🎄에 관한 주제가 많은 게 눈에 띄네요!
결론
넷플릭스가 성공한 핵심 요인 중 하나는 바로 빅데이터의 활용에 있습니다. 고객의 이용 정보 및 패턴을 수집하고, 그들이 다음엔 무슨 콘텐츠를 보면 좋을지 추천해주죠. 넷플릭스는 이러한 형태의 데이터 수집 및 분석을 계속 진행함으로써 매년 더 발전할 수 있었습니다.  세계 어느 지역에 어떤 콘텐츠를 추가할지 파악하고, 계속해서 사용자 기반 서비스를 향상시키는 데 있어 그들이 수집한 빅데이터는 매우 중요하게 작용했을 것입니다.

데이터 활용, 넷플릭스 같은 기업만 가능하다고요? 아닙니다! 우리도 충분히 많은 양의 데이터를 수집하고, 이를 분석해 다양한 분야에 적용할 수 있습니다. 스파이더킴에서 원하는 정보를 빠르게 수집해보세요!
💌피드백
보내주신 소중한 피드백을 바탕으로 디귿이 계속 발전하고 있어요🥰 정말 감사드려요! 디귿이 더 성장하기 위해, 의견이 있으시다면 적극적으로 말씀해주세요😊 그럼 오늘도 화이팅하세요✨
오늘의 디귿은 여기까지!
이번주 디귿의 뉴스레터, 어땠나요?
좋았던 점, 아쉬웠던 점, 더 알고 싶은 점 
마구마구 알려주세요!
'디귿'은 가장 쉬운 웹크롤링 서비스, 스파이더킴에서 발행하는 뉴스레터💌입니다.
스파이더킴에 방문하셔서 무료로 웹크롤링 서비스✨를 이용해보세요.
유펜솔루션
support@spiderkim.com
서울시 성동구 연무장 15길 11, B동 2층 스파크플러스 238호