[개발이야기#092] 스팀잇 전체 사용자 수집 시작

in #steemsearchlast month


안녕하세요 가야태자 @talkit 입니다.

제가 수집한 데이터가 전체 데이터인지는 모르겠습니다.

위에 보시다 싶이 일단 z로 끝나는 아이디가 있는걸로 봐서 전체 사용자 인 것은 같습니다.

그래서 사용자수를 잠깐 보겠습니다.

MariaDB [steemsearch]> select count() from author_collection_status order by created_at desc, author desc;
+----------+
| count(
) |
+----------+
| 1944465 |
+----------+
1 row in set (1.126 sec)

일단 한시간에 24명의 글을 동시에 수집합니다.

그런데 24명 중에 글이 많으면 더 많은 사용자가 수집 될 것으로 생각 됩니다. ^^

MariaDB [steemsearch]> select count() from author_collection_status where is_collected = 1
-> ;
+----------+
| count(
) |
+----------+
| 3628 |
+----------+
1 row in set (1.087 sec)

저 숫자 중에 3628명의 글을 수집 하거나 수집 완료 했습니다.

현재 사용자 기준으로는 0.2%정의 사용자를 수집 했습니다.

UI 개선은 안바빠지면 진행하고,

지금은 수집이라도 해야할 것 같아서

수집을 진행 하고 있습니다.

감사합니다.

개발 및 제공하고 있는 서비스

스팀잇 검색엔진 - http://search.whd.kr:5000/

스팀잇 검색엔진 구축 중

TALKIT 뱅크 - https://talkitbank.whd.kr

다중이체 서비스 제공

운동 앱 - http://140.238.11.226:5500/rankings

운동 기록을 정리해 드립니다.



Posted through the ECblog app (https://blog.etain.club)

Sort:  

잘 진행되고 있는 것 처럼 보이네요. 화이팅입니다.

일단 수집 부터 여러가지를 해보고 있습니다.
일단데이터가 있어야 검색도 많아 질 테니까요
감사합니다.

좋은결실로 이어지길 응원합니다~~

열심히 해서 좋을 결실을 맺어 보겠습니다.
감사합니다.

스팀잇 계정 약194만개 중
하루동안(?) 글을 작성한 계정이 3천6백여개 정도(0.2%)인가요?

화이팅~입니다! ^^

그건 아니고 지금까지 제가 3천 6백 여분의 글을 수집하고 Full 색인을 했다는 의미 입니다. ^^
많이 수집 한것 같았는데 ㅎㅎㅎ
1%도 안되네요 ㅠ.ㅠ