■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 801- 最新50

サイズが 480KB を超えています。500KB を超えると書きこめなくなるよ。

メモ4

1 :名無しさん@停滞中 ★ : 08/06/17 20:07:26 ID:???
はてさて思いついた事など


600 :名無しさん@停滞中 ★ : 10/07/28 21:20:27 ID:???
bg20も追加してみたです

dat
http://bg20.2ch.net/test/r.so/tsushima.2ch.net/news/1280125443/
subject
http://bg20.2ch.net/test/p.so/tsushima.2ch.net/news/

dat落ちしてもしばらくは読めるみたい
クラシックメニューと連携してはいない雰囲気ですが。
あとdatそのものだというのがなかなか





ところで、保全計画さんの所
スレッドのミラーURLが元スレのキーになったみたい。

http://www.hozen.org/

という事は、追加出来るですね。「その95」になるのかな。
ただ、板名が個々の数字に割り振られているみたいなので
wannabeさんや2chキャッシュさんの所のでやったような
データ変換テーブル(カッケー!)が必要になりますが。
あと、dat化正規表現は>>198のままでOKみたい


601 :名無しさん@停滞中 ★ : 10/07/30 00:44:24 ID:???
という事で追加
「その95」という事で

http://www.geocities.jp/mirrorhenkan/hozen/?u=http://love6.2ch.net/test/read.cgi/books/1128519108/

見た目少なく見えますが
リストを作ったら99板ミラーされておられるですね。


602 :名無しさん@停滞中 ★ : 10/07/30 00:49:08 ID:???
メモ
保全計画hozen.org(http://www.hozen.org/

URL例
http://www.hozen.org/bbs/40/1128519108/

正規表現(「長すぎる行があります」と出たので2行に分けてます)
m#<br><a name.+?>([0-9]+)</a> 名前:<span class="green"> *?<b>(?:<a href="(?:mailto:)?(.+?)" rel="nofollow">)?(.+?)(?:</a>)?</b></span>投
稿日:(.+?) ?<blockquote>(.+?)</blockquote>#mik

前処理
s#(<title>.+?) - .+? hozen\.org(</title>)#$1$2#ik


603 :名無しさん@停滞中 ★ : 10/07/31 19:47:23 ID:???
http://pc12.2ch.net/test/read.cgi/software/1279014618/706

書かれてませんがthreadic.comのdatread.cgi読み込み変更ありがとうございました!
でも自分以外使っている人居るのかな
結構日本人居るみたいですけど>threadic.com日韓交流板


というか
日韓交流板のofflaw.cgiエラーってやはり意図的なものなんだろうなと
でも9:25 AM Jul 19th の呟きとか見ると天然に知らない可能性もないではないかも

http://twitter.com/threadicdevelop/status/18814954444
-------------------------------------------------
@am0c 修正しました。 たくさんの書かれてみると、エラーがあったことは知らなかったですね... エヒョ?
9:25 AM Jul 19th Via web

@am0c 申し訳ありませんが、いくつかのAPIをおっしゃるのですが、基本的なデータの出力は、
offlaw.cgiファイルを使用してください。 使用方法は、read.cgiと同じです。
1:23 PM Jul 18th Via Twitter for iPhone in reply to am0c
-------------------------------------------------





あと戯言

http://be.threadic.com/thread/bbs-jp/read.cgi/koreajapan/1278496757/

スレ主(拙者男)さんって本当に現地の人なのかな。だとしたら凄いなー

ただ疑問なんですが、レス6で書かれてますが
サザエさんって海外で放送されてるのかな。検索してもわかんないですけど。
放送してなくても韓国では知られてるのかな。

サザエさんって確か著作権者の意向でDVDもダイジェストも出てないそうですし
JAとかのテレビCMに出ててもネットには一切出なくて
まるでジャニーズ並みだそうですが。

http://ja.wikipedia.org/wiki/%E3%82%B5%E3%82%B6%E3%82%A8%E3%81%95%E3%82%93#.E8.91.97.E4.BD.9C.E6.A8.A9.E5.95.8F.E9.A1.8C

そんななのに海外放送許可するのかなー。
あるいは日本からの放送電波を現地受信して見てるのかな。


同じ疑問が下のスレッドにもいえるです

http://blog.livedoor.jp/hisabisaniwarota/archives/51646707.html

レス70で

> クレヨンしんちゃんとサザエさんは完全に韓国製だと思ってました。

といってますが本当なのかな。
この一点だけとってみてもスレ主さんが本当に現地の人なのかどうなのか
今ひとつ確証が持てないです

それにしても、現地(韓国)でサザエさんって放送されているのか
ポピュラーなのかどうなのかって
どうやって調べたらいいんでしょうか。


604 :koreawatcher ◆Nida.eneRA : 10/07/31 22:22:45 ID:glAmqCha
>>603
そう言えば変更してたのに更新報告には書いてないですね。
画像認証があるのでもう投稿できないし、Xenoのスレにも
読み込めないとの苦情がまったく来ないので、たぶん他の人は
誰も使ってないと思います。


605 :名無しさん@停滞中 ★ : 10/08/01 14:18:29 ID:???
>>604
ですね
何だか寂しい


http://pc12.2ch.net/test/read.cgi/software/1279014618/824,826,829-831

いつも思うんですが、凄いですね。
いや本当に


606 :名無しさん@停滞中 ★ : 10/08/01 14:32:01 ID:???
メモ
2chまとめもどき(http://2ch.stdomk.net/)のdat化について

URL例
http://2ch.stdomk.net/read.cgi?%E7%9C%9F%E9%AD%9A%20%E3%80%9C%E3%83%86%E3%82%AD%E3%82%B9%E3%83%88%E3%82%A8%E3%83%87%E3%82%A3%E3%82%BF%E3%80%9C%201%20

正規表現
m#<div class='Re' id='.+?'>([0-9]+) 名前:(.+?) \[(.*?)\]: (.+?)<div class='Com'>(.+?)</div></div>(<div.+?>)#mik

変換結果式
$2<>$3<>$4<>$5<>  ←メール欄逆転

後処理
s#((?:^|\n).*?)(◆.+?)(?:(@.+?))?<>#$1</b>$2<b>$3<>#igk



スレッドのタイトルがURLの引数になっているみたいで、まずhtmltodatへのURLのコピー&ペーストが少し厄介。
いちおうブラウザ表示されたものをコピペするとURLエンコードしたものが入ると思うのですが
何だか失敗する場合も多いです。
失敗した場合下のようなhtmlが返ってきて、レス411でdat化出来てしまうのが何とも不思議だ

http://2ch.stdomk.net/read.cgi?hoge

もしURLコピペに失敗した場合はURLの末尾に「%20」をつけてみたら読み込めるかも。
実際上のURL例だと最初末尾が「〜%201」で駄目で、「%20」をつけて読み込めたので。
いろいろ試したですが再現性はよくわかんない。






で、URL例の場合ですと
やはりスレッドタイトル中の「〜」が「?」になってしまっているですが
まあ気長にお待ちしております


607 :名無しさん@停滞中 ★ : 10/08/02 19:29:47 ID:???
メモ

Dat2HTML Rev(http://aerial.st/software/dat2html_rev)のdat化について

html例
http://aerial.st/2ch-log/itoko/itoko-01.html

正規表現(長すぎるので4行に分けてます)
m#<dl.+?>\t+<dt.+?>\t+<span class="resNumber">([0-9]+)</span>\t+Name: <span class="resN
ame">(.+?)</span>\t+\[<span class="resMail">(.*?)</span>\]\t+Date: <span class="resDate">(.+?)</sp
an>\t+ID: <span class="resID">(.*?)</span>\t+(?:Be: <span class="resID">.*?</span>)?\t+</dt>\t+<dd cla
ss="resBody">(.+?)</dd>\t+</dl>#mik

前処理
s#Be: <span class="resID"></span>#$1$2$3#igk
//s#(ID: <span class="resID">.*?)</span>\t+Be: <span class="resID">(.*?</span>)#$1BE:$2#igk

変換結果式
$2<>$3<>$4 ID:$5<>$6<>


beがまだうまくいってないと思うんですが
資料が無いしまあいいや
そういうのがあったら考えるという事で。

あとこれだとIDの無い板の場合でも「ID:」というのがついてしまうけど
資料が無いしまあいいや
そういうのがあったら考えるという事で。


608 :名無しさん@停滞中 ★ : 10/08/02 19:47:45 ID:???
上のやつ
前処理の箇所も変でしたね
エラー出ないっぱかったからまあいいや

それとPortable Safari 4.6 for Windows をDLして試してみたんですが
Safariだと>>594のクリップボードコピーって出来ないっぽい。
あとchromeのほうも今やったら何だか出来ないのだけど何故だろう
594の時は出来てると書いてるのに


609 :名無しさん@停滞中 ★ : 10/08/06 20:19:23 ID:???
メモ
Gossip mate 引用ログ倉庫(http://gm.bpa.nu/bbs2/)のdat化について

URL例
http://gm.bpa.nu/read2.so/1258550880/

正規表現(長いので2行に分けています)
m#<DT><FONT.*?>([0-9]+) :<font color=green><B>(?:<a href="mailto:(.+?)">)?(.+?)(?:</a>)?</B></fo
nt>:(.+?)(?:</font>)?<dd>(?:<font class=basic>)?(.+?)(?:</font>)?<br><br>(<DT>|</dd>)#mik

後処理
s#((?:^|\n).*?)(◆.+?)(?:(@.+?))?<>#$1</b>$2<b>$3<>#igk
s#((?:^|\n).*?)(\[―\{\}\@\{\}\@\{\}\-\])(.*?)<>#$1</b>$2<b>$3#igk


610 :名無しさん@停滞中 ★ : 10/08/06 21:23:38 ID:???
>>608の件
Google Chromeでもクリップボードコピーボタンは効いていたです。
ただし、ボタンのかなり右側でクリックしないといけないみたい
他のブラウザでは出ない現象なので不思議だなと

それと、datのDLが復活したところがあるみたい。
でもアップデート時のバグかもしれないです
あんまり広がるとまたDL不可になるかもなので騒がず慌てずに


メモ
2log10=2 2ch過去ログ保管
http://2log10.web.fc2.com/2ch/index.html


611 :名無しさん@停滞中 ★ : 10/08/17 00:56:37 ID:???
メモ
プレイバック 2CH(http://tenrikyo.gnk.cc/)のdat化について

URL例
http://tenrikyo.gnk.cc/read.php?1281916732

正規表現
m#<dt.*?>([0-9]+).+?(?:"mailto:(.+?)">)?<b>(.+?)</b>(?:</font>|</a>) ?:(.*?)<dd> ?(.*?)<br><br>(<script|<dt.*?>|</dl>)#mik


>>275の正規表現をコピペしただけです
移転されても同じhtmlで感謝感激です


612 :名無しさん@停滞中 ★ : 10/08/17 01:36:54 ID:???
>>603
サザエさんの韓国放送の件ですが、調べても調べてもわかんないです。
なかったかどうか調べるって難しいですね。悪魔の証明とは言ったものだ
とはいえ、いろいろ調べると何だか放送されてなかったぽい。
これがサザエさんでなくドラえもんとかだったら無問題なんですけど。
あと関係ないですけど
キャンディキャンディも原作者さんが特別に認めて公認になってるですか

いちおうURL
http://plaza.rakuten.co.jp/seoulmiki/diary/200811120000/
http://www.d1.dion.ne.jp/~hi_chan/Happy_rain8705.htm
http://hannichi.exblog.jp/959487/
http://ameblo.jp/miwa1982/entry-10610818613.html
http://blogs.yahoo.co.jp/lovekorjap/12668489.html


ところでthreadic.comさん
また日本語オンリーの板を出されたですね。にしても何て板名だ
古いスクリプトでやってるのでofflaw.cgiもdatread.cgiも無いのでXenoで読めないです
てかXenoスレ見ると自分以外にもthreadic.comをXenoで見てる人居るんだなと

http://be.threadic.com/thread/bbs/read.cgi/tempadult/


そういえば自分とこ 国別アクセスを見ると
日本アメリカに続いて韓国がきてるんだよなー
そのあと台湾ドイツ香港カナダときてるです
何だろう非常に興味深い

http://www3.clustrmaps.com/counter/maps.php?url=http://www.geocities.jp/mirrorhenkan/#totals


613 :名無しさん@停滞中 ★ : 10/08/17 18:52:07 ID:???
メモ
2ちゃんねる過去ログ倉庫|日本語でおk(http://www.nihongodeok.net/log/)のdat化について

URL例
http://www.nihongodeok.net/thread/society6.2ch.net/test/read.cgi/gline/1165245437/

正規表現(長すぎるので3行に分けてます)
m#<div class="message_body" id="message_\d+"> +<h3 >([0-9]+)\. +<span class="name">(.+?)</spa
n> +<span class="info"> +(?:\[(.+?)\])? +(.+?)</span> +</h3> +<div class="message aa" style="font-si
ze:90%"> +(.+?) +</div> +</div>(<div class="message_body| +<script)#mik

前処理
s#<title.+?/title>##ik
s#<meta name="keywords" content="(.+?)" />#<title>$1</title>#ik
s#\n</?(?:meta|link|ul|script).+?(?=\n)##igk
s#\n +<li.+?(?=\n)##igk
s#<table[\s\S]+?</table>##igk
s#<br />#<br>#igk

変換結果式
メール欄逆転

後処理
s#((?:^|\n).*?)(◆.+?)(?:(@.+?))?<>#$1</b>$2<b>$3<>#igk
s#((?:^|\n).*?)(\[―\{\}\@\{\}\@\{\}\-\])(.*?)<>#$1</b>$2<b>$3#igk

過去ログ倉庫っぽくない過去ログ倉庫なんですが
直近のdat落ちスレッドがかなりカバーされておられるです
いやーすごいや

dat化ですが、改行と連続空白スペースが多いからなのか
ポツポツと時間がかかるです
あとURL例のレス3の箇所のように
文章内容が一部省略されている場合があるかも


614 :名無しさん@停滞中 ★ : 10/08/21 20:09:11 ID:???
西安版美人時計を付け足してみたです
あとipart.cnというSNS(?)が出しているがジェットも

広州(杭州?)版もなんちゃってガジェットこさえてみたですが
これphpだもんで設置した途端消えたらどうしようリンダ困っちゃうので
まだ考え中
コードは下記


<?
$val = file_get_contents("http://www.sodao.com/app/ShowTime/gt?pcs_id=1");

if (mb_ereg('path":"(http://.+?\.jpg)","path_s', $val, $v)) {
//echo $v[1];
echo "<a href=http://sodao.com/ target=_blank><img src=$v[1] border=0></a>";
}else{
//echo $val;
echo "抽出失敗";
}
?>


615 :名無しさん@停滞中 ★ : 10/08/22 20:27:07 ID:???
上のと北京版のもつけ加えてぼんやり眺めてたら
あやしうこそものくるをしけれ


メモ
隙間一行|海外の反応 | 美人時計
http://www.sukima1gyou.com/loglog/eid958.html


616 :名無しさん@停滞中 ★ : 10/08/24 08:04:09 ID:???
どうやら消えてしまっているようですね。
管理画面から見ても同様で。

どうしたもんですかなーー



http://popchat.nu/users/mirrorhenkan/






617 :名無しさん@停滞中 ★ : 10/08/24 08:58:08 ID:???
閲覧不能になっているというのに>>616のチャット接続人数が130人前後を推移しているので
見てみたら http://yellow.ribbon.to/~mirror/ からワンサカと来てるですね。

しかしまあ静かなものだ
もしかしたらこのまま何の反応も無いままいくかもしれない



618 :名無しさん@停滞中 ★ : 10/08/24 13:04:47 ID:???
仕方がないので急遽設置

http://mirrorhenkan.g.ribbon.to/



619 :名無しさん@停滞中 ★ : 10/08/25 21:54:29 ID:???
管理画面こんな感じ

http://image.threadic.com/images/0870b5b4efc3b65c315e8ac58b9afe5e0368f0e8.PNG

ガイドラインは以下

http://geocities.yahoo.co.jp/guideline/index.html

思い当たるのは

> ネットワーク帯域の占有など、利用状況が当社がYahoo!ジオシティーズの
> 提供にあたり予定する範囲を超えてサーバーやネットワークに負荷を生じ
> させていると当社が判断した場合

くらいかな。


自分とこ、JavaScriptで外部リンク生成してるだけだったですし
htmlとて150KBくらいのものだったんで
常時同時接続200人だったとはいえ・・・どうなんでしょうか。
むしろぽっぷちゃっとの方に負荷をかけているような気がしてたんですが。

あと、諸所のミラーサイトの各々のミラースレッドへの直リンクが
お行儀が悪いと思われた可能性もあるかも。
ただこれ 各ミラーサイトの方々には黙認して頂いていると思うですし
(何も連絡しなくてもリファラ等のアクセスログとかですぐ判る筈)
そんなに気にする事もないかと思っているのですが。

あとあれかな
http://aas.k2.xrea.com/test/sample.txt
とかの外部サイトについている広告が誤解されたのかな
まさか美人時計やuniqlockが広告と思われたのかな

まあ仕方ないです





620 :名無しさん@勉強中 : 10/08/25 23:49:53 ID:p0OCq5Qu
繋がらないと思ったら消えてましたか


621 :名無しさん@停滞中 ★ : 10/08/27 19:39:56 ID:???
メールアカウント残して頂けたのが不幸中の幸い
ありがとう浜村淳です

で、まだhttp://www.geocities.jp/mirrorhenkan1/とかあるですけど
移転稼動直後にオッペケペしたら立ち直れないので
しばらくそっとしといてやってください


さて、削除移転した事による影響はというと
下のそれぞれのURLのリンク先が繋がらなくなった事くらいかな
調べればもっとありそう

http://nanokawa.net/archives/individual/2005/1230123418.php
http://yomi.mobi/read.cgi/dubai/dubai_tv_1254828668
http://2chdat.soprano-asm.net/url.php?url=http://toki.2ch.net/test/read.cgi/morningcoffee/1281960325/

あと下のQAとか
http://qa.jiji.com/qa6138405.html

それと
>>435>>469>>493および
http://fatalita.sakura.ne.jp/CGI/2ch/index.html?text1=http://yutori7.2ch.net/test/read.cgi/news4vip/1270472109/
はどうするのやら。



ところで、早速直されたのですか。ありがとうございます。
http://2se.dyndns.org/test/readc.cgi/toki.2ch.net_morningcoffee_1281960325/


622 :名無しさん@停滞中 ★ : 10/08/28 19:53:17 ID:???
メモ
2channel archives(http://2log.mine.nu/vip_archive/)のdat化について

URL例
http://2log.mine.nu/vip_archive/thread/1282693639?ita=dat

正規表現
m#<dt>([0-9]+):<font color=green>()<b>(.+?)</b></font>:(.+?)<dd>(.+?)<br><br></dd></dt>#mik

前処理
s#(<b>)&n?bsp;(</b>)#$1$server$2#igk

$server
以下、名無しにかわりましてVIPがお送りします



$serverにはその板のデフォルト名無しが入るです


623 :名無しさん@停滞中 ★ : 10/08/28 19:57:15 ID:???
どうも画像のURL前後にspanタグをつけておられるみたい
例えばhttp://2log.mine.nu/vip_archive/thread/1278556992?ita=dat

前処理に下記を追加
s#<span.+?>(h?ttp://.+?)</span>#$1#igk


624 :名無しさん@停滞中 ★ : 10/08/28 22:48:47 ID:???
ちょいと怖気づいたんで

今回の引っ越した先(ribbon.to)なんですが
サーバの生ログがルートフォルダに4つ出るです

.ribbon_access_serverlog
.ribbon_errorlog
.ribbon_serverlog
.ribbon_cgierrorlog

で ですね
ribbon_access_serverlogが39メガ
ribbon_serverlogが23メガ
他の二つは0.7メガづつくらい

ということで
生ログだけで60メガ強あるみたいなんですよ。
ログを開くだけでPCが落ちそうな感じで、38万行ほどあるようで。
でも、ぽっぷちゃっとやxrea/googleのアクセス解析を見てみると
geocitiesの時の半分くらいのアクセス量なんですな

いやー、geocitiesだとこういう生ログみたいなのって見れなかったんですが
やはり消されたのはネットワーク負荷が原因なんですかね。
デカい画像とか全然使ってないシンプルなものなんですが。


で、ribbon.toさんのところを見てみると

http://ribbon.to/httpd/faq_heavyaccess.php

消されないとの事で一安心なんですが
そのうち上下にでかい広告がついてポップアップ広告も出るかもしれない。
あと503エラーが頻発するようになるのかも。



アクセス量っておそろしいもんですなー。
でも有料サーバに移って広告貼っても
採算とれるかどうかわかんないですし。
どんなもんなんでしょうか。


625 :名無しさん@停滞中 ★ : 10/09/03 20:12:32 ID:???
その97・その98追加
あとその86(>>622)のdat化用リンク先変更

それと、iswebが終了するそうなのであちこちリンク先変更
http://isweb.www.infoseek.co.jp/info/information.html

自分の身近な所だと、htmltodatとJaneXenoとdat2htmlがiswebですね。
あとJane本家本元のtwddleさんの所も消えてしまうのか


626 :名無しさん@停滞中 ★ : 10/09/09 18:28:24 ID:???
メモ

http://bbsreader.takeomi.jp/yuzuru.2ch.net/news4vip/1283861485/

上ですが
http://yuzuru.2ch.net/test/read.cgi/news4vip/1283861485/
がdat落ちしても閲覧出来ていたら嬉しいです

ちなみにここって
http://yy14.kakiko.com/test/read.cgi/mirror/1158402994/127
でも出したところですが
http://yy14.kakiko.com/test/read.cgi/mirror/1158402994/201
の返答頂いたので
4年越しですが待っていますです


あと2ch3.comさん(その59)の所
現役スレッドにも対応なさったみたい


627 :名無しさん@停滞中 ★ : 10/09/09 18:54:55 ID:???
dat落ちしたですが閲覧可能でしたので追加したです
「その99」という事で。dat化用正規表現は後日

「その59」のdat化用正規表現が変わってるかどうかも見なきゃですか。
少なくともスレッドタイトルの前処理は変更が必要ですね


628 :名無しさん@停滞中 ★ : 10/09/10 07:45:34 ID:???
一晩経ったら>>626は閲覧出来なくなってたですけど
dat落ち後少なくとも2時間くらいは読めてたのを見たのでそのままで。

ところで
http://bbsreader.takeomi.jp/2ch.net/
から各板各スレッドの記事を読むにはどうすればいいのでしょうか。



メモ

ハードウェア
http://www.pchd.2chmatome.info/


629 :名無しさん@停滞中 ★ : 10/09/12 08:36:00 ID:???
メモ

次スレログ
http://jitterbug.dtiblog.com/


630 :名無しさん@停滞中 ★ : 10/09/12 21:28:50 ID:???
メモ

http://tmobile.ddo.jp/r.php/kamome.2ch.net/tvd/1282038419/

↑このサイト(http://tmobile.ddo.jp/)って以前見た時は
dat落ち直後にすぐ短パンマン登場だったんですが
kamomeが飛んだ今 何故か上のとか見れてますね。


631 :名無しさん@停滞中 ★ : 10/09/18 15:31:07 ID:???
その100・その101・その102と追加してみたです
dat化用正規表現その他は気が向いた時に



メモ

http://www.2ch3.net/


632 :名無しさん@停滞中 ★ : 10/09/21 23:19:31 ID:???
メモ

http://arcadeita.net/


633 :名無しさん@停滞中 ★ : 10/09/22 03:35:50 ID:???
2chスレまとめツール公開 - 2chmeme(2ちゃんミーム)
http://2chmeme.net/news/46b1dbd480d7023d2fc94fac27972c89


634 :名無しさん@停滞中 ★ : 10/10/03 14:31:52 ID:???
NoScriptの憂鬱: べつになんでもないこと
http://puppet.asablo.jp/blog/2010/04/17/5024464

NoScriptというツールがあるのですか


635 :名無しさん@停滞中 ★ : 10/10/10 19:08:23 ID:???
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038409548/113-114n

お元気そうで何よりでした
自分も救急車に乗ったりしたけど何とかやってます


636 :名無しさん@停滞中 ★ : 10/10/16 12:53:31 ID:???
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/611

あちこちURL変更したです
まだまだあるかもしれない

というかお隣さんになったですね。
ここって生ログが閲覧出来るのが何だか怖いです
>>624以降、アクセスログだけで100メガ以上あるですし。
CGIが使えるといっても使うのに勇気が要るです


637 :名無しさん@停滞中 ★ : 10/10/16 17:29:23 ID:???
保全計画(http://www.hozen.org/)さんがリニューアルして大幅に増やされたので
こちらも対応
URL例
http://mirrorhenkan.g.ribbon.to/hozen/?u=http://love6.2ch.net/test/read.cgi/gender/1247405571/

対応板がすごい増えてるです。
前回は99板だったのに659板になってて
変換テーブル(カッケー!)の追加が少し時間がかかったです

テーブルやってて思ったのが下の2点

1. ガイドライン板(http://www.hozen.org/bbs/149/)って存在してないような。
2. アンケート板(http://www.hozen.org/bbs/44/)ってスレッド内容からして金融板のような。


変換テーブル作成ですが、ソースを真魚に貼り付けてperl風置換である程度整形してからやったですが
コピー&ペーストでやるとかえって遅かったので
途中から手打ちにしたのでスペルミスとかあるかもしれないので
ミスを見つけた人がいたら教えて下さい
リストは下記

http://mirrorhenkan.g.ribbon.to/hozen/list.txt



で、やってて ↓このエントリーを思い出したです
程度もレベルも段違いだけど

http://blog.livedoor.jp/dankogai/archives/51523822.html


638 :名無しさん@停滞中 ★ : 10/10/20 19:56:57 ID:???
ぽっぷちゃっとで教えて頂いたので
神の目(http://god.martian.se/2ch/)のURL書式を変更したです
「その93」になるんですか

教えてくれた人ありがとうです
もしかしたら神の目の管理人さんなのかもと思ったり


639 :名無しさん@停滞中 ★ : 10/10/26 08:13:48 ID:???
メモ

2ch携帯ブラウザ
http://m2ch.com/
携帯PINKちゃんねる
http://pink2ch.com/

dat落ち後の挙動はどうなるのでしょうか
短パンマン回避との事なのでどうなるのかな
http://m2ch.com/1.htm


640 :名無しさん@停滞中 ★ : 10/10/26 17:24:26 ID:???
取り急ぎ

http://m2ch.com/m/r/yuzuru.2ch.net/news4vip/1288051560

上ですが

http://yuzuru.2ch.net/test/read.cgi/news4vip/1288051560/

がdat落ち後に閲覧出来ていたら嬉しいです(私が)

bg20サーバからdat読みしておられる所だったら
dat落ち後も暫くは閲覧可能なんですが
その辺りはどうなのでしょう


641 :名無しさん@停滞中 ★ : 10/10/26 21:00:30 ID:???
閲覧出来なくなってました
いえ別にいいんです


642 :名無しさん@停滞中 ★ : 10/11/19 12:59:24 ID:???
メモ
18禁広告注意

ttp://gachoon.com/bbs/diskmans-2ch/board26/#menu
ttp://gachoon.com/bbs/diskmans-2ch/test/read.php/board26/1282873512/

よくわかんない
board1からboard26以降 どこまであるのかわかんないですし
それらが板毎の振り分けになっているかどうか。
一応最下部に板別リンクみたいなものはあるですが
上の例だとAV板とニュース速報板がごっちゃになってますし。


一番のネックは、アダルト広告とか何とかではなく
元のスレッドとキーが違うことで。

http://mirrorhenkan.g.ribbon.to/key/date2key.html

↑でレス1の日付を見てみたら
「入力された日付は2010年08月27日00時21分33秒です
キー変換すると1282836093」
という事で、元スレは

http://kamome.2ch.net/test/read.cgi/news/1282836093/

のようで。


さてどうしたものか。
別にどうもしないか


643 :名無しさん@停滞中 ★ : 10/11/19 13:16:35 ID:???
上の
http://kamome.2ch.net/test/read.cgi/news/1282836093/
って削除されてるみたいですね。
でもあちこちのミラーで1001まで読める。

あと
http://gachoon.com/bbs/diskmans-2ch/test/read.php/board26/1282873512/
ってレス番が飛んでるしダイジェストだったみたい
まあいいか


644 :名無しさん@停滞中 ★ : 10/11/20 21:21:48 ID:???
メモ
2ちゃん過去ログ倉庫(http://log.cms.am/)のdat化について

URL例
http://log.cms.am/log/2ch.net/gline/1204534743.html

正規表現
m#<dt>([0-9]+) : <font color=green><b>(.+?)</b></font>\[(.*?)\] +(.+?) <dd> (.+?)<br><br>#mik

変換結果式
メール欄逆転


645 :名無しさん@停滞中 ★ : 10/11/22 20:54:31 ID:???
メモ
s-lib.net(http://s-lib.net/)のdat化について

URL例
http://s-lib.net/board/gline.kamome.2ch.net/1284501599/
http://s-lib.net/board/sureh.yomi.bbspink.com/1152228870/
http://s-lib.net/board/gengo.kamome.2ch.net/1284048536/

正規表現(長すぎるので2行に分けてます)
m#<span class="res_num">([0-9]+)</span> <span class="res_date">(.+?)</span> <a href="ma
ilto:(.*?)">(.+?)(?:\((ID:.*?)\))?</a><br> +</div> +</a> +(.+?) +</div>(<div class="res">|\t<p>)#mik

前処理
s#<title[\s\S]+?/title>##ik
s#<h1>(?:\d+res/min \[.+?\])?(.+?)\n#<title>$1</title>#ik

変換結果式
$4<>$3<>$2$5<>$6<>

後処理
s#((?:^|\n).*?)&l?t;/b&g?t;(◆.+?)&l?t;b&g?t;(<>)#$1</b>$2<b>$3#igk


変換結果式を見ても判るですが、かなり特殊な感じ。
IDが出ない板でも「ID:」というのが出ているので(URL例3番目のように)
そこでの「ID:」を表示させたくないなら、変換結果式を
$4<>$3<>$2<>$6<>
とすればいいかも。

あと、文字コードUTF-8ですが、大抵のブラウザで文字化けするみたい。
で、htmltodatのバージョンが0.8.18未満のものだと文字化けするかもです
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/604

で、まだ今のところの話ですが
http://s-lib.net/board/gline.kamome.2ch.net/1284501599/
のレス5〜7のように
データ中の「〜」や「-」は文字化けしてしまうです


# 対応して頂けたら嬉しいです(私が)
# http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/605


646 :名無しさん@停滞中 ★ : 10/11/23 22:46:08 ID:???
という事で
3つほど追加させていただいたです


メモ

葉鍵日報ログ
http://nippoudairi.2-d.jp/hakagi_nippou/index.html

自分とこ出てるですが
以前のとこみたい


647 :名無しさん@停滞中 ★ : 10/12/31 13:34:50 ID:???
メモ

http://peach.archive.ailesblanc.com/test/read.cgi/hgame2/1288763055/

dat化は・・・誰かやってくれないかな


648 :名無しさん@停滞中 ★ : 11/01/01 19:44:12 ID:???
メモ

2ch勢いランキング:過去ログ置き場
http://archive.2ch-ranking.net/

URL例
http://archive.2ch-ranking.net/doujin/1276193856.html

かなり前に追加してはあったけど(「その101」)
それ以降かなり過去ログ倉庫が充実化されておられるので
いちおうdat化の方策(つか正規表現)とかやっといたほうがいいかもしれない
でも絶望的に時間と余裕が無いので
誰かやってほしかったりしますがどんなもんでしょ

あたしゃ疲れちゃったよ(って正月早々書くような事でもないが)



649 :名無しさん@停滞中 ★ : 11/01/02 11:19:34 ID:???
いちおうメモ

2ch勢いランキング:過去ログ置き場(http://archive.2ch-ranking.net/)のdat化について

URL例
http://ranking.sitepedia.jp/cache.php?thread=hayabusa.2ch.net/liveanb/1293888022/
http://2ch-ranking.net/cache.php?thread=hayabusa.2ch.net/liveanb/1293888022/
http://archive.2ch-ranking.net/liveanb/1293888022.html

正規表現(長すぎるので複数行に分けてます)
m#<dt id="title\d+"><div class="gi"><a href="\#\d+" class="trigg
er" name="\d+" id="res\d+">([0-9]+)</a><div class="popup" nam
e=".+?"></div></div> : <span style="color:.+?"><b>(.+?)</spa
n></b> \[(.*?)\] (.+?)</dt><dd id="content\d+">(.+?)</dd>(<d
t|</dl>)#mik

前処理(長すぎるので複数行に分けてます 本来は「s#」が行頭にある2行)
s#<div class="gj"><a href="javascript.+?><span class="trigger">(I
D)</span></a><div class="popup".+?></div></div>(:.+?</dt>)#$1$2#igk
s#<a.+?onclick=\"be\((\d+)\).+?>\?([A-Za-z]{3}\(\d+\))</a>#BE:$1-$2#igk

変換結果式
メール欄逆転



いちおうこれでdat化出来るっぽい
ただしBE表記の変換がまだ出来てない



上の場合、レス523と578でBEが出ていますが
元のdatでは

BE:3751430988-PLT(16701)

となっている箇所が、上のhtmlだと

<a href="#" onclick="be(1055091029); return false;">?PLT(16701)</a>

となっているです。

つまり、
元datの「3751430988」が
htmlだと「1055091029」に置き換わってるっぽい。
htmlからbeをクリックして飛んでみてもそのプロフィールに行くみたいだし
わざわざBEの基礎番号を計算して置き換えてるのかなと

だもんで、前処理の2行目で「BE:1055091029-PLT(16701)」となるようにやってるんですが
何だかうまくいかない。
しまいにはfatal error連発でhtmltodatが落ちて折角書いた正規表現が飛んじゃったり
トホホ

もう少しだが今回はこのくらいで勘弁してやるからな
覚えてろよ(雑魚キャラの常套句)




650 :名無しさん@停滞中 ★ : 11/01/03 10:00:15 ID:???
メモ

眠れる森
http://sasara.kirara.st/


651 :名無しさん@停滞中 ★ : 11/01/03 10:38:31 ID:???
>>649の件
避難用のとこに書いとこか
これで通常業務に戻れるわの

http://jbbs.livedoor.jp/bbs/read.cgi/computer/38622/1192586163/35


652 :名無しさん@停滞中 ★ : 11/01/03 11:29:53 ID:???
>>649
レスアンカーもあったか

s#<div class="bi">(&?gt;&g?t;\d+)<div class="popup" name="\d+"></div></div>#$1#igk


653 :名無しさん@停滞中 ★ : 11/01/03 11:36:39 ID:???
ちゃうちゃう
前処理に下二行を追加

s#<div class="bi"><a.+?>(&?gt;&?gt;\d+)</a><div class="popup" name="\d+"></div></div>#$1#igk
s#<script[\s\S]+?/script>##igk


654 :名無しさん@停滞中 ★ : 11/01/03 12:19:18 ID:???
まいったのお
なかなか離れられねべさ

http://archive.2ch-ranking.net/intro/1293610703.html

↑これでdat化しようとするとfatal errorの連発ではないか
困っちゃうでし


655 :名無しさん@停滞中 ★ : 11/01/03 15:10:36 ID:???
何とかなったかな
前処理に下のを追加して
「s#<script[\s\S]+?/script>##igk 」を削除
つか差し替えというべきか

s#push\(t\[\d+\]\)\;t\[\d+\]\.##igk

>>654のhtmlソースでいうと1086行目がネックになっていたっぽい
いやわかんないけど


656 :名無しさん@停滞中 ★ : 11/01/04 11:29:16 ID:???
いちおう決定版という事で。

http://jbbs.livedoor.jp/bbs/read.cgi/computer/38622/1192586163/36

>>655の前処理だと、万一名前や本文中に
「push(t[123]);t[123].」なんてのがあっても消してしまうっぽかったので。

それと>>649

> わざわざBEの基礎番号を計算して置き換えてるのかなと

そんな事もなさそうではないではないか
あたしバカよね


それとあれかな
2ch log sercher(http://hagephone.dip.jp/test/)さん(「その66」)がリニューアル復活されたので
今までの正規表現だとマッチしなくなったかな
誰かやってくんないかな
あたしゃ疲れちゃったよ


dat落ちスレ復活依頼スレもかなり前にdat落ちした事だし
もうそろそろココの役目も終了かな


657 :名無しさん@勉強中 : 11/01/11 04:33:31 ID:ikLugpRK
BE基礎IDの求め方
$beid = (int($benum/100) + (int($benum/10) % 10) - ($benum % 10) - 5) / ((int($benum/10) % 10) * ($benum % 10) * 3);

BE番号の求め方
$benum = ($beid * 3 * $x * $y - $x + $y + 5) * 100 + $x*10 + $y;  (※$xと$yは1〜9のランダム)
その結果、$beの十の位には$x、一の位には$yが必ず入る。
例)3751430988ならば$x=8、$y=8 1055091029ならば$x=2、$y=9


658 :名無しさん@停滞中 ★ : 11/01/12 20:08:39 ID:???
>>657さん
どもです

ところで、これって
今回流出したキャップとか削除スクリプトとかと共に出たものなのでしょうか。

いや、全然中を見てないんで何なんですが
以前BE基礎IDの計算方法を出された方のを見てJavaScriptでやったものがあったので
それと同じものなのかどうなのかと。
タイムスタンプを見たら2007/8/20のようで。

http://mirrorhenkan.g.ribbon.to/others/be_id/


参考に(つかコピペさせてもらった)スレッドはこちら

Be ID(登録連番)の計算式を解析しました \(^o^)/
http://news23.2ch.net/test/read.cgi/news/1187537803/



そういえばJaneNidaで基礎Be番号を計算するものが出たのは↓これが最初だったなーと

http://pc11.2ch.net/test/read.cgi/software/1178892330/812


659 :名無しさん@停滞中 ★ : 11/01/12 20:46:28 ID:???
メモ
2鯖(http://2chserver.com/)のdat化について

URL例
http://2chserver.com/army/1210613397/

正規表現
m#<dt.+?><a.+?>([0-9]+)</a> :<span><b>(.+?)</b></span>(?:\[(.+?)\])?:(.+?)</dt><dd.+?>(.*?)</dd>#mik

前処理
s#<title.+?/title>##ik
s#<h1>(.+?)</h1>#<title>$1</title>#ik

変換結果式
メール欄逆転


660 :名無しさん@停滞中 ★ : 11/01/13 19:15:59 ID:???
メモ

http://zaftzaft.orsp.net/owata.php?host=hibari.2ch.net&key=linux&thre=1273856128.dat


661 :名無しさん@停滞中 ★ : 11/01/22 16:11:55 ID:???
メモ

気象予報士関連スレ保管庫
http://www.chinacacties.com/


662 :名無しさん@停滞中 ★ : 11/01/31 20:10:17 ID:???
メモ

ものすごい勢いで2ちゃんねる実況の過去ログをまとめるページ
http://areya.tv/2ch/makeimghtml.php

ここ「その98」として追加させて頂いているんですが
以前は「areya.in」というドメインだったです
で、数日前まではareya.tvに301転送しておられたんでそのままだったですが
現在areya.inはドメイン売り出し中との事で
もう転送してくれないです

同じ事は>>649の2ch勢いランキングさんにもそのうち起こるのだろうなと。
http://country-blues.seesaa.net/article/167402330.html

現在は
http://ranking.sitepedia.jp/  →  http://2ch-ranking.net/
とリダイレクトしてくれてますけど
sitemixからさくらインターネットにサーバ移動されたとの事なので
そのうちsitepedia.jpからリダイレクトしなくなるのかも

http://country-blues.seesaa.net/article/164539333.html




まあどちらも此方が直せばいいだけの話なので
いつかそのうち直す時の為のメモという事で。


663 :名無しさん@停滞中 ★ : 11/01/31 20:29:53 ID:???
http://d.hatena.ne.jp/heiwaboke/20110131/1296406918

凄いの一言。

やはり投資をしないとリターンもないのだなーと


664 :名無しさん@停滞中 ★ : 11/01/31 20:40:41 ID:???
>>663の記事読んで思い出した

>>283で出したログ速さん(当時はokawari.netさん)の
URL書式とサイト名変更(最初「2c」としかわからなかった)って
その当時 ログ速の管理人さんからメール頂いて直したんだっけなーと。
文面から とてもいい人だなと思ったものでした。

ログ速さん サイト運営等に関するメモとか出されてないのかな


665 :名無しさん@停滞中 ★ : 11/01/31 20:45:53 ID:???
と書いてから見たら
一週間前からtwitterされておられるのですか
botやスレ紹介とかではなく


666 :名無しさん@停滞中 ★ : 11/02/05 20:20:40 ID:???
神の目さんの所
移転されたようで

http://god.martin.se/2ch/

http://labs.digitalhell.net/2ch/


今の所リダイレクトされてるですが
されなくなった時用に自分メモという事で


667 :名無しさん@停滞中 ★ : 11/02/12 17:14:12 ID:???
メモ
2chまとめ速報-anime(アニメ)
http://nukusoku.net/anime/category/%E3%82%A2%E3%83%8B%E3%83%A1%EF%BC%92/


668 :名無しさん@停滞中 ★ : 11/02/21 01:32:45 ID:???
メモ

2ちゃんねるバックアップ(http://www.2chan.cc/)のdat化について

URL例
http://www.2chan.cc/detail/288575

正規表現
m#<dt>([0-9]+) :(?:<a href="mailto:(.+?)">|<font color=green>)<b>(.+?)</b>(?:</font>|</a>):(.+?)<dd>(.+?)<br><br>#mik

前処理
s#<title.+?/title>##ik
s#<th.+?><font.+?>(.+?)</font>#\n<title>$1$</title>#ik
s#(<dt)#\n$1#igk
s#\n ?\t.+?(?=\n)##igk


ここなのですが、元スレとの関連性がないURLなので今のところ検索だけが頼りなんですが
何だかタイトルだけでしかヒットしないような。
スレッドIDだとヒットはするんですけどリンクが出てこないです

http://www.2chan.cc/search?title=1297595047&type=1

タイトル検索はOKなのにスレッドIDではヒットするもののリンクが出てこないのは何なので
直して頂けたら嬉しいです(私が)
もしくはスレッドIDを含んだURLにして頂けたらなと


それと、上のURL例の場合、デフォルト名無しが
「名無しさん@まいぺ?す」
となってしまうですが
htmltodat側で直して頂けたらとても嬉しいです(私が)



いえ、名前欄だけだったら
前処理で

s#名無しさん@まいぺ?す#名無しさん@まいぺーす#igk

とかすればいいのでしょうけど。。


669 :名無しさん@停滞中 ★ : 11/02/21 01:37:53 ID:???
って

>>668
前処理で

s#(<dt)#\n$1#igk

の次に

s#名無しさん@まいぺ?す#名無しさん@まいぺーす#igk

を追加しても、名前欄が
「名無しさん@まいぺーす」
にならない・・・

なんでだろう。


670 :名無しさん@停滞中 ★ : 11/02/21 08:45:16 ID:???
自己レス


s#名無しさん@まいぺ?す#名無しさん@まいぺーす#igk

 ↓

s#名無しさん@まいぺ\?す#名無しさん@まいぺーす#igk



アホでした


671 :名無しさん@停滞中 ★ : 11/02/21 17:52:48 ID:???
さらに見落とし


s#名無しさん@まいぺ\?す#名無しさん@まいぺーす#igk

 ↓

s#名無しさん@まいぺ\?す#名無しさん@まいぺ〜す#igk



私バカよね


672 :名無しさん@停滞中 ★ : 11/02/23 21:25:23 ID:???
メモ

ブイ2ちゃんねる
http://www.v2ch.net/

何だか個人ニュースサイト(?)で取り上げられてたんですか
で、スレッドも立ってたみたいで

http://enqnews.com/news/net/2011010801.html
http://hato.2ch.net/test/read.cgi/news/1294476012/


673 :名無しさん@停滞中 ★ : 11/02/23 21:34:30 ID:???
上のを知ったのはhttp://kakolog.info/から飛んだ先だったので。

というか、kakolog.infoさんのところ
自前保存はおやめになられたのかな
Googleキャッシュを見ると色々あるみたいですけど

http://www.google.co.jp/search?sourceid=chrome&ie=UTF-8&q=kakolog.info


674 :名無しさん@停滞中 ★ : 11/02/26 21:25:57 ID:???
メモ

キャッシュ倉庫
http://www.iranai.me/

URL例
http://gline.iranai.me/test/read.cgi/2011/1298608188/
dat
http://gline.iranai.me/2011/dat/1298608188.dat


datもあるなんて嬉しや
後で追加させてもらうです
「その108」になるのかな

ココっていつ頃からやっておられたのでしょう?
ググってもわかんなかったんですが面白いのがヒットしたです

http://webku.jp/www.iranai.me


で、自分とこも見てみたりして。

http://webku.jp/www.mirrorhenkan.g.ribbon.to

よくわかんないけどどういう事なんだろう。
よくある「あなたの値段はこれこれです」という奴のweb版?

---------------------------------
ウェブサイトバリュー    ¥81,624,031.17 *
1日のページビュー数   90,683 *
1日の訪問者        33,390 *
ワールドワイドランク   15,270
---------------------------------
日本国 ランク        941


675 :名無しさん@停滞中 ★ : 11/03/02 19:41:53 ID:???
>>457復活感謝



>>609は301移動するようになったみたい
以上移転時メモ用

http://gm.bpa.nu/read2.so/1190548945/

  ↓

http://gm.bpa.nu/bbs/1190548945/


676 :名無しさん@停滞中 ★ : 11/03/02 19:45:16 ID:???
メモ

12歳の記憶(地震板まとめ)
http://12at1995.net/
うち以外の地震板過去ログまとめサイト
http://12at1995.net/#other_archive_sites


677 :名無しさん@停滞中 ★ : 11/03/02 20:03:34 ID:???
メモ

denpark
http://www.denpark.net/
http://www.denpark.net/link.htm



板一覧

ピュアオーディオ板
http://hifi.denpark.net/
クラシック板
http://classic.denpark.net/
デジタルカメラ板
http://ccd.denpark.net/
絵本板
http://efon.denpark.net/
考古学板
http://zinbun.denpark.net/
民俗学・神話学板
http://minzocu.denpark.net/
神社仏閣板
http://bukkak.denpark.net/
電波・お花畑板
http://www.denpark.net/



URL例

電波・お花畑板
http://www.denpark.net/2009log/1253858910.html
電波・お花畑板以外
http://efon.denpark.net/1026793682.html



これに対応するとしたら
変換テーブル(カッケー!)作るしか無さそう


678 :名無しさん@停滞中 ★ : 11/03/02 20:08:08 ID:???
追加

宗教・教団板
http://um.denpark.net/index.html


679 :名無しさん@停滞中 ★ : 11/03/12 18:26:31 ID:???
>>674
http://megalodon.jp/2011-0312-1820-53/www.iranai.me/

早すぎる気もしないではないですが
運営お疲れ様でした


http://d.hatena.ne.jp/heiwaboke/20110311/1299772952

まだ幾つかあるような気もしないではないですが
労作お疲れ様でした


680 :名無しさん@停滞中 ★ : 11/03/14 18:49:47 ID:???
メモ

まとめ2ちゃんねる (仮)
http://q2ch.riahure.net/

ダイジェストですが
dat落ちしたスレッドの分も閲覧出来るみたい


681 :名無しさん@停滞中 ★ : 11/03/17 19:50:26 ID:???
メモ

http://tokusetsu.sakura.ne.jp/news4vip/
http://tokusetsu.sakura.ne.jp/newsplus/
http://tokusetsu.sakura.ne.jp/tokusetsu/


682 :名無しさん@停滞中 ★ : 11/03/18 18:14:33 ID:???
メモ

http://news.qwe.jp/


683 :名無しさん@停滞中 ★ : 11/03/19 14:25:30 ID:???
メモ

q2ch - 過去ログのDAT化 - はけの徒然日記
http://d.hatena.ne.jp/hake/20070219/p1

Rubyでhtmlをdat化するスクリプト。

いつかRubyも勉強してみたいところではある


684 :名無しさん@停滞中 ★ : 11/03/20 19:27:21 ID:???
もてない女板ログ
http://wmotenailog.x.fc2.com/


685 :名無しさん@停滞中 ★ : 11/03/22 19:02:44 ID:???
2chmeme(2ちゃんみーむ)
http://2chmeme.com/

元スレのキーが各ミラーに含まれていたらありがたい


686 :名無しさん@停滞中 ★ : 11/03/24 18:54:54 ID:???
桃羽書庫 PINKちゃんねるエロゲ3板(hgame,erog,hgame2)全文検索
http://peach.archive.ailesblanc.com/

明日の日経平均を予想するスレまとめ
http://nikkei225.infomoney.jp/

電脳速報
http://ebrain-news.com/pc/index.php


それと imona.netさん ドメイン切れになってるような
http://imona.net/


687 :名無しさん@停滞中 ★ : 11/03/26 00:55:55 ID:???
メモ

萌Search
http://moemoe.zitaku.org/index.php

URL例
http://moemoe.zitaku.org/dat.php?server=hibari.2ch.net-news4vip&datid=1300981731


単なるメモなので


688 :名無しさん@停滞中 ★ : 11/04/03 10:43:18 ID:???
メモ
アジ通Scheme(http://ecksdays.com/)のdat化について

URL例
http://ecksdays.com/index.php?thread=1299789952
http://megalodon.jp/2011-0403-0951-55/ecksdays.com/index.php?thread=1299789952

正規表現(長すぎるとの事で二行に分割)
m#<div id="res_\d+" class="res"><p><div class="name">([0-9]+): <strong class="green">(.+?)</stron
g> \[(.*?)\] (.+?)</div></p><div class="res_body"><p>(.+?)</p></div>#mik

前処理
s#<meta.+?>##igk
s#<td.+?/td>##igk
s#\n\t<p>.+?</p>##igk
s#<title.+?/title>##ik
s#<a.+?><h2>(.+?) の画像一覧</h2></a>#<title>$1</title>#ik
s#<s class="red">(h?ttp:.+?)</s>#$1#igk

変換結果式
メール欄逆転



これ 前処理で
s#\n(?:<meta|</?td|</?tr|\t<p>).+?(?=\n)##igk
とか最初やってみたらなぜかマッチしなかったんで
残念だけど3行に分けてやってみたです

URL例で出したものは1001到達したスレッドを適当に選んだだけで他意はないです
ただ こういったスレでもレス24あたりから東北大震災(正式名称はまだ判らんですが)の話題になってるなと。
あと、トリップ付きの名前やbe書き込みが見つからなかったのでそこら辺も一考の余地があるのかもしれない


689 :名無しさん@停滞中 ★ : 11/04/03 12:19:11 ID:???
メモ

漫画 2ch過去ログ・スレッド保管庫
http://www.comic-2ch.com/
映画 2ch過去ログ・スレッド保管庫
http://www.cinema-2ch.com/


690 :名無しさん@停滞中 ★ : 11/04/13 20:55:20 ID:???
メモ
「2chz 過去ログも見れる2chビューア」(http://2chz.org/)のdat化について

URL例
http://2chz.org/thread.php/live/livenhk/1302676690/
http://megalodon.jp/2011-0413-1811-42/2chz.org/thread.php/live/livenhk/1302676690/

正規表現
m#<dt>([0-9]+) :(?:<a href=".+?mailto:(.+?)">|<font.+?>)<b>(.+?)</b>(?:</font>|</a>):(.+?)<dd>(.+?)<br><br>#mik

前処理
s#\n\t+<(?!dt|dl|h2).+?(?=\n)##igk
s#\n\t+ <(?:li|a).+?(?=\n)##igk
s#<title.+?/title>##ik
s#<h2.+?>(.+?)</h2>#<title>$1</title>#ik
s#<dl class="thread">#<dt>#ik
s#(<dt>)#\n$1#igk


サイトのタイトルで「過去ログも見れる2chビューア」と謳ってあるですが
現状 dat落ちしたらレス1しか見れないような。
とりあえずweb魚拓もつけてメモしとくです

ちなみにweb魚拓のhtmlをhtmltodatで呼び出すには
「受信オプション」→「HTTPヘッダの追加」で
呼び出したいURLをリファラとして追加すれば現状読み込めるです
上の例だと
referer:http://megalodon.jp/2011-0413-1811-42/2chz.org/thread.php/live/livenhk/1302676690/
とか。


691 :名無しさん@停滞中 ★ : 11/04/13 21:35:33 ID:???
メモ
2ちゃんねるログ.com(http://www.2ch-log.com/)のdat化について

URL例
http://www.2ch-log.com/hatsukari.2ch.net/news/1302593449/
http://megalodon.jp/2011-0413-1807-36/www.2ch-log.com/hatsukari.2ch.net/news/1302593449/

正規表現
m#<dl><dt><a.+?>([0-9]+)</a>:(.+?):(.*?):(.+?)</dt><dd>(.+?)</dd></dl>#mik

前処理
s#<title.+?/title>##ik
s#<h1>(.+?)</h1>#<title>$1</title>#ik

変換結果式
メール欄逆転


web魚拓のソースを見てみると

<meta name="description" content="2ちゃんねるでdat落ちしたスレッドタイトル「(中略)」を保管しております。すでに閲覧出来なくなっているページなどが無料で閲覧することができますのでご自由にお使い下さい。" />


とあるのでそのうち改善なさってくれると思うです


ちなみにweb魚拓のhtmlをhtmltodatで呼び出すには
「受信オプション」→「HTTPヘッダの追加」で
呼び出したいURLをリファラとして追加すれば現状読み込めるです
上の例だと
referer:http://megalodon.jp/2011-0413-1807-36/www.2ch-log.com/hatsukari.2ch.net/news/1302593449/
とか。


692 :名無しさん@停滞中 ★ : 11/04/13 21:42:45 ID:???
>>691
トリップ前後の</b><b>が消えてるようなので
後処理に下記を追加

s#((?:^|\n).+?)◆(.+?)<>#$1</b>◆$2<b><>#igk


ちなみにURL例
http://www.2ch-log.com/hibari.2ch.net/news4vip/1302619954/
http://megalodon.jp/2011-0413-2139-36/www.2ch-log.com/hibari.2ch.net/news4vip/1302619954/

>>691で出したURL例は実況板のスレッドだったので
意図的に保存していないという可能性はあるのかな


693 :名無しさん@停滞中 ★ : 11/04/13 21:50:29 ID:???
・・・

> >>691で出したURL例は実況板のスレッドだったので

うそつき。


694 :名無しさん@停滞中 ★ : 11/04/13 22:34:53 ID:???
やりかけメモ
ちゃんろぐ(http://chanlog.net/)のdat化について

URL例
http://chanlog.net/news4vip/1302619954/

正規表現
m#<dt.+?>([0-9]+):<span class="name"><b>(.+?)</b></span>(?:
<span class="mail">\[(.+?)\]</span>)?:(.+?)</dt><dd>(.+?)</dd>#mik

前処理
s#<title.+?/title>##ik
s#<h1>(.+?)</h1>#<title>$1</title>#ik
s#(\n) {4}#$1#igk
s#<div>[\s\S]+?</div>##igk

変換結果式
メール欄逆転


これではうまくいかなんだ
誰か教えてほしいものだす


695 :名無しさん@停滞中 ★ : 11/04/16 23:58:17 ID:???
6つほど追加して
2つほど修正

eucalyptus.さん
ちゃんログ管理人さん
サイト構築&御連絡ありがとうございました


696 :名無しさん@停滞中 ★ : 11/04/18 09:38:48 ID:???
メモ

2ちゃんねるデイリーニュース-2DN-
http://news2ch.6.ql.bz/

URL例
http://news2ch.6.ql.bz/index.php?page=single&cat=0&logid=1302703367


697 :名無しさん@停滞中 ★ : 11/04/18 09:41:20 ID:???
TENMOU NEWS
http://tenmou-news.com/

URL例
http://tenmou-news.com/pc/news.php?bc=1&c_number=1302703367


698 :名無しさん@停滞中 ★ : 11/04/19 00:07:31 ID:???
Medichannel
http://medich.net/

URL例
http://medich.net/2ch/utu/1295087596/
http://megalodon.jp/2011-0419-0006-54/medich.net/2ch/utu/1295087596/


699 :名無しさん@停滞中 ★ : 11/04/19 00:12:51 ID:???
>>698追記

アトピー
http://medich.net/2ch/atopi/
アレルギー
http://medich.net/2ch/allergy/
メンタルヘルス
http://medich.net/2ch/utu/
身体・健康
http://medich.net/2ch/body/

後で追加させてもらおう


500 KB
続きを読む

掲示板に戻る 全部 前100 次100 最新50
名前: E-mail (省略可) :

read.php ver2.4 2005/04/13

Gポイントポイ活 Amazon Yahoo 楽天

無料ホームページ 楽天モバイル[UNLIMITが今なら1円] 海外格安航空券 海外旅行保険が無料!