[w-filter] kr 실시간 피드 + 스패머 탐지 사이트 개발 진행중 !!

in #kr6 years ago

w-filter 개요

jjangjjangman 등을 통한 보팅나눔은 우리에게 풍족한 삶을 제공하고 있습니다. (저도 개인적으로 1일 1회 사용중에 있고요) 하지만, 이를 악용하는 외쿡계정에서는 날로 지능화 되어가는 노력을 통해 풀펌과 한국어 공부에 여념이 없는 것 같습니다. 물론 시작은 불순하지만 추후 한국어 포스팅과 적절한 답글을 제공한 다면 정말 멋진 일 이지만, 풀펌과 본문과 관계없는 태그 사용으로 보팅만 쪽쪽 빨아 먹는 것은 나쁜 행위라 생각 합니다.

그래서 해당 대상글을 손쉽게 찾을 수 있도록 웹사이트를 개발중에 있습니다.

w-filter 기본 기능 소개 (개발 진행중 - 70% 정도 ㅋ)



[그림 1 : 블랙리스트 + 한글미포함 ]



[ 그림 2: 한글미포함 ]

  • 10초 마다 kr 최신글 정보를 로드
  • 제목, 본문(마크다운 제거후) 200자 발췌
  • 블랙리스트 관리 - 블랙이 글쓴 경우 블랙리스트 라고 표기됨 => 또 걸리면 또 kr-guide 등으로 신고
  • 제목, 본문에 한글이 포함되지 않은 경우 한글 미포함이라 표기 됨 => 확인 후 신고
  • author를 선택하면 해당 author 피드로 이동
  • 제목 또는 본문 클릭 시 해당 글로 이동

장점으로는 10초 단위 신규글 갱신인지라 그냥 켜 둬도 볼만함.
일단 PC전용 / 모바일로 보기에는 본문을 봐야 되서 ... 힘듬
단점으로는 좀더 지능적으로 분류를 해야 되는데 이것은 두고두고 관리를 해야 될 것으로 예상 됩니다. 블랙리스트 정보는 기존에 운용했던 autovot + 오치님 현상글에서 추가

맺음말

잠깐 테스트로 운용해 봤는데도 바로 걸려 드네여

물론 지능범은 본문을 자세히 살펴 봐야되는 어려움이 있습니다. 이는 블랙리스트 처리로 함 걸려들면 태그로 표기하여 물고 늘어지기 =_=

기타 좋은 아이디어 있으면 제보 부탁 드립니다.

Sort:  

양심불량 외쿡인들...

고생하셨습니다.

아직 좀더 만들어야 ...

계정 최신글 10개 정도 조회 후 댓글에 krguide나 cheetha 가 댓글을 작성항 경우 그것도 표현 하려고여

대단하십니다. 응원드리고 가요!
혹시 언어는 파이썬으로 하시는 건가요? (궁금해서요)

steemjs를 이용하여 html로 작성 했습니다.
nodejs로 만들면 좀 더 깔끔하게 가능하긴한데
배포가 문제라 ㅋ

정말 좋은 일 하시네요. 보리로 응원합니다. 👍

응원 늘 감사합니다 ^^

@virus707님글에도 댓글을 달긴했는데 글 내용중의 단어를 뽑아서 자동댓글 봇을 돌리는 사람이 있긴더군요. 그래서 가끔은 매우 진지한 글에 엉뚱한 댓글이 달리는데. 진짜처럼 보이는 댓글과 포스팅도 병행하는 분이라 참 애매한데 혹시 익명 구글신고폼같은 건 없나요? 본래목적과는 다르게 이용될 소지도 있으니 아주 간단하게 댓글 링크 제출 정도로만 운영하는 것도 좋을 것 같습니다. 근데 결국엔 수동으로 판단해야할테니 뭔가 인력이 많이 필요할듯해서 애매하네요ㅠㅠ

네 마지막 판단은 사람인지라... 애매하긴 하죠. ㅜㅜ

역시 세상에 기술자들이 많은거 같아요. 대단하십니다. ^ㅡ^

스패머 !!!!
개발 잘 되시라고
@칭찬해

황홀한 @wonsama님 안녕하세요! 개사원 입니다. 러블리한 @smigol님 소개로 왔어요. 칭찬이 아주 자자 하시더라구요!! 시크한 글 올려주신것 너무 감사해요. 작은 선물로 0.4 SBD를 보내드립니다 ^^

역시 나쁜쪽으로는 사람들이 머리가 잘돌아가나 봅니다

패턴 게시물이라 단순하게 운용하시면 쉽게 그 패턴의 허점을 파고 들어 패턴 게시물을 만들어 냅니다.
블록체인 정보로 계정들을 조회하면 재밌는 것들이 많이 발견되는데 외국인이 한국인으로 위장하는 경우도 있고 한국인데 외국인인처럼 위장해서 한국게시물에 올리는 분도 있어요. 걸려도 외국인으로 생각되게하는 방법이지요. 고난위도 방법이지요.
참고로 외국인인처럼 보여도 실제 그 계정의 소유주가 한국인일 가능성도 있다는 점 참고해 주세요.

네 그런거 같아요

그래서 태그를 활용하려고여
신고 한다기 보단

기존 블랙에 등제된 아이디 태깅
제목 본문 한글없음 태깅
기타 패턴이 추가되면 해당 패턴 태깅

리포트시 블랙 추가.해제

그래도 결국은 사람이 판단은 해야 될 것 같습니다.

부가적으로 데이터가 어느정도 더 쌓이면 word2vec 등을 적용하여 상관도 분석도 해보려고여

좋은 의견 감사합니다

pairplay 가 kr-dev 컨텐츠를 응원합니다! :)