w-filter 개요
jjangjjangman 등을 통한 보팅나눔은 우리에게 풍족한 삶을 제공하고 있습니다. (저도 개인적으로 1일 1회 사용중에 있고요) 하지만, 이를 악용하는 외쿡계정에서는 날로 지능화 되어가는 노력을 통해 풀펌과 한국어 공부에 여념이 없는 것 같습니다. 물론 시작은 불순하지만 추후 한국어 포스팅과 적절한 답글을 제공한 다면 정말 멋진 일 이지만, 풀펌과 본문과 관계없는 태그 사용으로 보팅만 쪽쪽 빨아 먹는 것은 나쁜 행위라 생각 합니다.
그래서 해당 대상글을 찾아 공유하고, 보팅이 좀 더 글에 사용되기를 바랍니다. (현재는 autovot에 kr-guide, cheetah 등으로 걸린 대상에서 필터링 조건을 찾아내는 중 )
현재는 특이한 유형이 나오는 경우에 한정하여 관련 정보를 추가하여 공유할 예정 입니다. 최종 목표는 어느정도 로직을 만들어서 별도 계정의 봇을 만든 후 대상글을 탐지하여 데일리 리포트 하는 것 입니다. 현재는 자료 수집 중
오늘의 스패머
( 계정도 계정이지만 아래 스팸글 의심 방법을 확인 바랍니다. )
구글 검색 비교
- 작성 글

- 구글 검색 결과

- 역시 펌글, 물론 출처나 해당 원문에 대한 개인의견 1도 없음
최근 댓글 스샷

- 천만예요 - 오타라고 생각하기엔 자판 간격이 너무 멀고, 문법오타?로 보기에도 넘 힘듬.
글 검색 전 스팸글 의심
추후 필터링 자동화에 쓸 자료 입니다. 이외 스팸의심글의 구분 방법을 아시는 분은 댓글로 피드백 부탁 드립니다.
대략 1~2달 정도 정보를 모으면 어느정도 공식이 나올 것으로 예상 => 개발 착수
- 이상하게 대댓글이 없다
- 해당 글의 태그가 개연성이 없다
- 컨텐츠의 분류(구분선)도 없고 태그(마크다운)사용이 없거나 제목정도(단순 복붙이기 때문)
- 댓글의 한글이 영 아니올시다.
[참조] 정말 한국어를 배워나가는 멋진 외국인이 쓴 글이 가끔 오분류 될 수도 있습니다. 이런 글은 피드백(댓글) 주시면 바로 정정하도록 하겠습니다.