사용자 도구

사이트 도구


research:autotorrentrg:manual

AutoTorrentRG Manual

AutoTorrentRG는 아래와 같이 여섯개의 세부 설정을 가지고 있습니다.

  • 헤더 설정 (connector)
  • 접속 설정 (access)
  • 로그인 설정 (login)
  • 크롤러 설정 (crawler)
  • 필터 설정 (filter)
  • 다운로더 설정 (downloader)

이 설정들은 모두 ini 확장자를 가진 텍스트 파일로 저장됩니다. 아무 텍스트 편집기로 직접 편집해도 되고, GUI버전을 사용할 경우 '설정' 대화 상자를 이용하여 편집을 할 수 있습니다. 표에서 굵은 글씨로 표기된 항목은 GUI에서 사용자가 “고급 설정 열기”를 체크하지 않아도 편집 가능합니다.

헤더 설정 (connector)

이 설정은 AutoTorrentRG가 서버에 보내는 request header를 꾸며주는 역할을 합니다. Firefox v17.0을 기본으로 하여 만들었으며 특별한 이유가 없는 한 변경할 필요는 없습니다. 기본값은 다음과 같습니다.

변수기본값 설명
user-agent“Mozilla/5.0 (Windows NT 6.2; rv:17.0) Gecko/17.0 Firefox/17.0”ini 파일의 주석 처리를 방지하기 위해 큰따옴표로 감쌉니다.
accepttext/html,application/xhtml+xml,application/xml
accept-language“ko-kr,ko;q=0.8,en-us;q=0.5,en;q=0.3”user-agent와 마찬가지로 큰따옴표로 감쌉니다.
accept-encodinggzip, deflate
connectionkeep-alive
verbosen

접속 설정 (access)

기본적으로 웹에 접속하기 위한 정보를 기록하고 있습니다. 이 또한 토렌트알지의 주소 및 사이트 체계가 변경되지 않는 한 특별히 손볼 필요가 없습니다. 웹브라우저를 통해 토렌트알지의 각 게시판을 직접 접속해 보면 쉽게 이 값들을 이해할 수 있습니다.

변수기본값 설명
board_base_url http://www.torrentrg.com/bbs/board.php게시판의 기본 주소입니다.
article_base_url http://www.torrentrg.com/bbs/board.php각 게시물들의 기본 주소입니다.
attach_base_url http://www.torrentrg.com/bbs/download.php첨부 파일의 기본 주소입니다.
table_var bo_table각 게시판을 구분하는 변수의 이름입니다.
table_vals 대상 게시판들의 이름입니다. 여러 게시판을 공백으로 구분하여 입력할 수 있습니다.
page_var page게시판 페이지를 구분하는 변수의 이름입니다.
article_id_var wr_id게시물을 구분하는 ID를 위한 변수의 이릅입니다.
attach_var no첨부파일을 구분하기 위한 변수의 이름입니다.
attach_val_reg javascript:file_download\('./download.php\?.+no=([0-9]+)첨부된 파일 중 토런트 파일을 골라내기 위한 정규 표현식입니다. 캡쳐 안의 값은 토런트 파일을 알아내는 데 필요한 숫자입니다.
wait_sec5하나의 접속을 수행한 후 대기하는 시간입니다. 최소값은 5초입니다.

로그인 설정 (login)

토렌트알지는 로그인이 필요없지만, 때때로 로그인이 필요한 경우가 있습니다. 이 경우 AutoTorrentRG는 웹브라우저와 마찬가지로 로그인을 할 수 있습니다.

변수기본값 설명
do_loginy로그인 과정을 수행할지를 정합니다. 'y/n/1/0/t/f' 등을 사용할 수 있습니다.
id_varmb_id아이디를 위한 폼 변수 이름입니다.
id_val 아이디를 입력합니다.
pw_varmb_password비밀번호를 위한 폼 변수 이름입니다.
pw_val 비밀번호를 입력합니다. 특별한 암호 처리가 되지 않습니다.
urlhttp://www.torrentrg.com/bbs/login_check.php로그인을 위한 주소입니다.
base_formurl=http%3A%2F%2Fwww.torrentrg.com%252F로그인을 위해 POST 방식으로 값을 전달합니다. 아이디와 비밀번호 이외의 값은 미리 이곳에 정의합니다.
success_tokenlocation.replace('http://www.torrentrg.com/')로그인이 성공할 경우 서버에서 송신하는 메시지를 정의합니다. 메시지 일부만 적어도 되지만, 반드시 로그인이 성공했을 때만 보이는 메시지를 적어야 합니다.

크롤러 설정 (crawler)

각 게시판에 접근하여 지정한 범위의 게시판의 제목을 수집하는 것을 프로그램은 '크롤링(crawling)'이라고 하며 이것을 수행하는 모듈을 '크롤러'라고 부릅니다.

변수기본값 설명
min_page1크롤링할 페이지 최소값입니다.
max_page9크롤링할 페이지 최대값입니다.
incremental_fetchy새 게시물만 수집합니다. 갱신된 내역만을 크롤링합니다. 한 번 이상 실행해야 동작합니다.
stamp_file.\Settings\default.stamp마지막으로 크롤링된 게시물이 무엇인지 기록하는 파일입니다.
reg_exp<a href="../bbs/board.php\?bo_table=%table_var%&wr_id=([0-9]+)[^>]*"><span>(.+?)</span></a>게시판에서 게시물 제목만을 수집하기 위한 정규식입니다. 첫번째 캡쳐는 게시물의 ID이고, 두번째 캡쳐는 게시물의 제목입니다. 매직 워드인 %table_var%는 검색할 때 table_var의 값으로 치환됩니다.
success_token<form name=fsearch method=get>게시판에 올바르게 접근했는지 판단하기 위한 HTML 코드의 일부를 적습니다. 이 내용이 발견되지 않으면 올바르게 게시판에 접근하지 못한 것으로 간주합니다.

필터 설정 (filter)

크롤링된 게시판 제목은 토렌트로 받을 영상 파일의 제목과 관련이 깊습니다. 게시판의 제목, 즉 영상 파일의 이름에서 우리가 다운로드 받으려는 영상만을 자동으로 골라내는 것을 '필터링(filtering)'이라고 합니다. 필터링을 수행하는 모듈을 '필터'라고 부릅니다.

변수기본값 설명
filter_namekeyword필터의 종류를 지정합니다. 현재 “키워드(keyword)” 필터와 “정규식(regexp)” 필터를 지원합니다.
filter_file.\Settings\filter.txt필터 파일의 경로입니다.
case_insensitiven대소문자를 구분하지 않을지를 결정합니다.

다운로더 설정 (downloader)

'다운로더'는 토렌트 알지에 접속하여 필터된 목록의 토렌트 파일을 사용자의 하드디스크로 다운로드받는 역할을 하는 모듈입니다.

변수기본값 설명
client_pathC:\Program Files\BitTorrent\Bittorrent.exe토렌트 프로그램(클라이언트)의 경로입니다.
args/ANSI /DIRECTORY “./Downloads” “%1”토렌트 클라이언트에게 전달될 인수 목록입니다. 토렌트 클라이언트는 반드시 명령 프롬프트에서 사용할 수 있어야 합니다. 매직 워드인 %1은 다운로드된 토렌트 파일의 이름으로 치환됩니다. ./Downloads는 토렌트 클라이언트가 다운로드 받는 영상 파일이 저장되는 경로를 의미합니다. 이 인수 목록은 토렌트 클라이언트의 종류에 따라 달라질 수 있습니다. BitTorrent, uTorrent는 기본값을 써도 무방합니다.
save_path.\Torrents토렌트가 저장되는 경로입니다.
only_downloadn토렌트 파일을 다운로드 받기만 합니다. 토렌트 클라이언트에 전달하지 않습니다. 이것이 y이면 remove_after_download가 y여도 토렌트 파일은 삭제되지 않습니다.
remove_after_downloady성공적으로 토렌트 클라이언트에 전달된 토렌트 파일은 삭제합니다. 쓸데없이 토렌트 파일이 축적되는 것을 방지하므로 켜 두는 것이 좋습니다.

필터 파일 형식

  • '#' 기호는 한 줄 주석을 의미합니다. 공백도 허용합니다.
  • '섹션'란에 항목이 기입됩니다. 각 섹션은 게시판의 종류에 따라 구분됩니다.
  • 섹션은 대괄호('[ ]')로 감싸져 있는 부분입니다.
  • 섹션은 2번이상 반복되어서는 안됩니다. 파일에서 단 한 번만 나와야 합니다.
  • 섹션은 2단어로 구성되어 있습니다. 첫 번째 단어는 keyword/regexp 중 하나이고, 두 번째 단어는 table_val 값 중의 하나가 되어야 합니다.
  • 섹션 아랫줄부터 한 줄에 하나씩 필터를 기입합니다.

필터 파일의 예제

###### 필터 파일의 예제입니다. #####
[keyword torrent_tv]         # '키워드' 방식의 '드라마' 게시판에 대한 필터를 정의합니다.
대풍수 HDTV H264 !450p        # '대풍수', 'HDTV', 'H264'가 있고 '450p'는 있지 않은 게시물을 선택합니다.

[regexp torrent_tv]          # '정규식' 방식의 '드라마' 게시판에 대한 필터를 정의합니다.
보고.*싶다.+(X|H)264.+-(Baros|HANrel)

스탬프 파일 형식

한 줄에 하나씩 table_val에 대한 ID가 적혀 있습니다. 각 ID는 이전 크롤링 때의 가장 최신 게시판 ID입니다. 만일 초기화하고 싶다면 스탬프 파일을 삭제하거나 각 내용을 모두 0으로 만들면 됩니다. ID란 각 게시물을 구분하는 단위입니다. 웹브라우저에서 각 게시물에 접속했을 때 표시되는 주소 중 article_id_var=XXXXXX의 숫자 부분을 ID라고 합니다.

table_vals 값 목록

게시판 이름
torrent_movie 영화
torrent_blueray DVD/BLU-RAY
movie_info 릴정보
torrent_tv TV/드라마
torrent_variety TV예능
torrent_mid 해외TV
torrent_song 해외음원
torrent_docu 다큐/교양
torrent_sports 스포츠
torrent_ani 애니메이션
torrent_util 유틸
torrent_game 게임
torrent_iphone 휴대기기
torrent_etc 기타
test1 동영상
torrent_child 유아/어린이
research/autotorrentrg/manual.txt · 마지막으로 수정됨: 2014/10/09 21:24 저자 127.0.0.1

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki