tattertools, Tistory, Textcube 등 TT계열 블로그의 백업화일의 문법 형식은 아주 간단하다.
<blog type=”tattertools/1.1″ migrational=”true”>
<post slogan=”text주소” format=”1.1″>
<author domain=”textcube.com”>숫자</author>
<id>숫자</id>
<visibility>public</visibility>
<title>도메인 관련 사이트 목록</title>
<content> 글 내용 <content>
<attachment @@#$%%^> 첨부화일 내용 </attachment>
<location>장소</location>
<password>암호-시스템이 정한 랜덤문자</password>
<acceptComment>댓글 숫자</acceptComment>
<acceptTrackback>엮인글 숫자</acceptTrackback>
<published>1255196239</published>
<created>1255196239</created>
<modified>1255196239</modified>
<category>포스트 분류</category>
<tag>태그 단어</tag>
</post>
<notice format=”1.1″>
공지사항 내용
</notice>
<logs><referer></logs>
<statistics><referer></statistics>
<statistics><visits></statistics>
<statistics><daily></statistics>
<guestbook></guestbook>
<filter type=”???”></filter>
</blog>
※ migrational=”true” → 기존 블로그에 복원 내용을 추가
※ migrational=”false” → 기존 블로그 내용을 모두 지우고 새로 복원 (사실상 무의미)
<setting> 등의 태그 내용은 모두 삭제해도 무방
블로그를 백업하면 큰 화일이 되기 쉬운데, 이들 대부분은 <post> 태그의 내용이다. 특히 첨부화일을 다루는 <attachment> 태그 안의 첨부화일은 용량이 한도 없이 커질 수 있다. <post> 이외의 내용은 모두 합해도 몇십 KB 정도이다.
만약 백업화일을 나누는 프로그램을 만든다면 <post> 태그만 용량별 또는 분류별로 나누는 형태로 하는 것이 좋다. 나머지 태그는 몽땅 한 화일에 담거나 삭제해도 무방하다.
보통 백업파일 업로드는 어떤 방법을 사용하더라도 2GB 한계가 있고, 실질적으로 올리는 건 10MB 한도가 있을 수 있으므로 백업파일 자르는 용량은 작을수록 좋다. 때로는 포스트 하나가 50MB 이상이 될 때도 있고, 또 백업파일을 복구하기 전에 선택을 원활히 하려면 포스트 하나하나를 각각 백업파일로 나누는 것이 가장 좋다.
파일명은 “#.제목.xml” 형식 정도면 족한데, 이때 들어갈 숫자는 id 태그를, 제목은 title 태그를 쓰면 된다. category를 추가하면 더 좋을지도 모르겠다. 모든 백업파일은 <post> 태그 앞과 뒤에 각각 다음 태그를 붙이면 되는데, 포멧 형식이 바뀔 경우를 대비해 여기에 들어갈 내용을 사용자가 직접 대입할 수 있으면 좋다.
포스트 앞에 추가해야 할 태그
<?xml version=”1.0″ encoding=”utf-8″ ?>
<blog type=”tattertools/1.1″ migrational=”true”>
포스트 뒤에 추가해야 할 태그
</blog>
xml 파싱을 이용해 백업파일을 나누는 것은 컴퓨터의 과부하 문제가 발생하므로 사실상 불가능한 것 같다. 다른 방법을 찾아야 할 듯….
- format
백업파일 형식이 몇 번 개정되었기 때문에 있는 옵션. 신경쓸 필요 없다. - slogan, id
tattertools 계열의 블로그는 post 주소를 나타내는 방법이 사용자가 입력한 문자열을 이용하는 방식과 숫자를 이용하는 방식 두 가지가 있다. slogan은 사용자가 입력한 문자열(특별히 편집하지 않았다면 처음 저장할 때의 포스트 제목)이며, id는 시스템이 순서대로 배정한 숫자다.
백업파일을 복구했을 때 이전에 썼던 글의 주소를 유지하기 위해서 이 둘은 수정하면 안 된다. - author domain
글 작성자를 숫자로 나타낸다. - visibility
글 상태가 어떤 상태인지 나타낸다. 모든 tattertools는 공개/비공개 모드는 있고, 티스토리(tistory)는 보호 모드가 하나 더 있다. - title
포스트 제목이다. - content
포스트 내용이다. - attachment
포스트에 첨부된 파일이다. - location, tag
포스트와 관련된 중요한 장소와 단어를 하나씩 기록한다. - password
각 포스트마다 암호를 지정한다. visibility에서의 보호 모드와 관련이 있다. - acceptComment, acceptTrackback
포스트에 붙은 댓글과 엮인글 개수를 표시한다. - published, created, modified
포스트의 공개/생성/수정한 시간을 기록한다. - category
포스트를 등록한 분류이다.


일단 분활->분할…^^;
감사합니다. 수정했습니다.
간단하군요. 저는 TTXML을 TeX으로 변환하는 프로그램을 생각해 봤었는데요.
어쨌든 XML이니까 XML파서를 써서 잘 잘라주고, 잘라낸 자료들을 잘 옮겨주면 되지 않을까요…-_-;
XML파서에 대해 배우게 되면 한번 시도해 보겠습니다. (언제 할지는 몰라요…;;)
이게 대용량 화일들이라서 수정이 쉽지많은 않더라구요. ^^;