- 스몰데이터란? [스몰데이터] 프롤로그
안녕하세요, 행복한카피바라입니다.
스몰데이터의 두 번째 주제는 '떡락장이 온다는 징조가 있을까?'입니다.
어제 저점을 놓쳤기 때문에, 어제 일어나자마자(라고 해봤자 오후 2시경..ㅎㅎ) 코인 친구 하나를 추매하여 평단을 낮추었습니다.
반등 최대 부분보다 10% 정도 아래에 평단을 맞추어 놓았으며, A코인의 빨간불이 한 5~10%로 들어올 때 한번, B코인의 빨간불이 5~10%로 들어올 때 A코인과 함께 풀매도할 예정입니다. 안전하게 가는 게 짱짱입니다용.
→ A코인 5~10% 지점 분할매도 성공! 풀매도는 아직 진행중입니다.
이번주 최저점에서 매수하지 못하였기 때문에 장투용 코인의 저점잡기는 다음으로 미루어집니다. 2월이 끝나려면 아직 멀었으니까요!
뉴스 기사 감성 분석
저번 글에서는 뉴스 기사의 빈도수만 보았다면, 이번에는 빈도수 + 감성까지 보겠습니다. 감성은 크게 부정/중립/긍정으로 두었습니다.
- 부정 관련 기사
- 중립 관련 기사
- 긍정 관련 기사
뉴스 기사 빈도수 및 감성 비율
(단위: 개)
왼쪽은 뉴스 기사 빈도수를 긍/부정과 함꼐 표현한 표이구요, 오른쪽은 각 날짜에 따른 감성 비율을 나타낸 것입니다.
다 빨강으로 뒤덮여 있습니다... 긁적긁적. 온통 부정적인 기사들이 올라오는군요.
그나마 12월 1일은 긍정적인 기사가 50% 정도 차지합니다.
- 12월 1일 관련 기사
12월 3일은 전부 부정으로 나오는데, 아마 수집 기사 개수가 적어서인 듯합니다.
저번 장에서 다루지 않았지만 1월 22일~24일 역시 뉴스 기사의 빈도수가 다른 날들에 비해 많습니다. 한번 이 날짜들에서는 시간대별로 어떻게 감성이 나왔는지 한번 보겠습니다.
뉴스 기사가 24시간 내내 나오는 게 아니기 때문에, 아침-낮-저녁 시간대에 몰려 있음을 알 수 있습니다.
우선 22일의 낮 시간대에는 다른 날들에 비해 적고, 차트 역시 상승하는 모습을 보입니다.
- 1월 22일 관련 기사
23일의 10:30분~11:30분 사이에 갑자기 기사가 대폭발합니다. 그리고 얼마 안가 차트는 곤두박질칩니다. 재밌는 건, 기사가 엄청나게 나온 10시 반과 11시 반 사이에는 상승하고 있었습니다.
- 1월 23일 관련 기사
24일 낮에는 23일보단 적지만 그래도 기사들이 꾸준히 나왔고, 비트코인의 가격 역시 다시 상승하였습니다.
- 1월 24일 관련 기사
맺음말
사실 트레이닝:테스트 비율을 80:20으로 두어야지 더 정확한 결과가 나오겠지만, 20:80으로 두었기 때문에 결과가 제대로 나오지 않았습니다. (수작업의 한계 ㅠㅠ) 딥러닝 기법이나 기타 다른 기법들을 이용하여 구한다면 더 좋은 결과가 나오겠죠? 그래서, 머나먼 다음에는 공부도 할 겸 해서 여러 기법들을 이용하여 감성 분석을 심도 있게 해보는 걸로 주제를 삼으려고 합니당. 또한 딕셔너리를 구축하는 방법에 대해서도 같이 다루어볼까합니다! 이때 딕셔너리는 명사/형용사/동사로 이루어진 감성 단어들로 채워넣을 예정입니다.
아무튼 이번 주제에 대한 답은 해본다면...
Q. 떡락장이 온다는 징조가 있을까?
A. 언론이 떡락장을 만든다고 볼 수 없음. 왜냐하면 그들은 늘 부정 기사를 쓰기 때문이당.. 물론 규제 법안 얘기와 같이 묵직한 게 나와 갑자기 기사가 우수수 떨어질 때는 제외. 떡락장 직전에 마지막 상승이 있을 수 있으니 그때 팔거나 아니면 마음을 비우고 강제 존버할 것. 그리고 한 두 개의 기사들만 B라는 내용을 다룰 경우 의심해보는 게 좋음. 찌라시일 확률이 높습니당. 이것 때문에 아주 혹시나 (우연히) 가격 떨어질 때 패닉셀 니은니은. 확실한 내용이라면 여러 언론사/기자들이 다룹니다용.
다음 주제는 무엇이 좋을까..하다가..이걸로 정했습니다. '하락장인데도 거래대금이 늘어난다고?'
예상 답안은 흠. 단타쟁이들의 증가이려나요. 잘 몰겠네용. 목적은 '거래대금의 변화를 통해 들어갈 때를 알아보자!'입니다.
보잘 것 없는 내용이다만, 글을 읽어주셔서 감사합니다!