■掲示板に戻る■
全部
1-
101-
201-
301-
401-
501-
601-
701-
801-
最新50
サイズが 480KB を超えています。500KB を超えると書きこめなくなるよ。
メモ4
1 :
名無しさん@停滞中 ★
: 08/06/17 20:07:26 ID:???
はてさて思いついた事など
436 :
名無しさん@停滞中 ★
: 10/03/18 17:02:03 ID:???
メモ
Ria Service
http://www.riaservice.com/
http://app.riaservice.com/threadex/?t=2&u=http%3A%2F%2Fyutori7.riaservice.com%2Ftest%2Fread.cgi%2Fnews4vip%2F1268887986%2F
↑これですが
これ↓がdat落ちしても閲覧可能だったら有難いです
http://yutori7.2ch.net/test/read.cgi/news4vip/1268887986/
まあ
http://www.riaservice.com/?page_id=2
で説明あるですが
一応メモという事で
437 :
名無しさん@停滞中 ★
: 10/03/18 18:06:04 ID:???
ダメでしたか
いえいいんです
ところで
韓国の姿を見せてくれる! ??? ??? ????!
http://threadic.com/thread/bbs/read.php/japanese/1268644780/
↑このスレッドに貼ってある画像をJaneXenoで展開したいんですが
どうやれば良いのだろう
画像URLは例えば下記
http://image.threadic.com/images/ZqEOH5reFB1
http://image.threadic.com/images/7DD7kbioWY0
どうもURLはこれでないといけないようで、拡張子やスラッシュを入れるとエラーになるです
なのでImageVierUrlReplace.datやReplaceStr.txtでゴニョゴニョという事でもなさそう。
貼られたものを見つける都度
URL右クリック→対象をビューアで開くでやるのも何だかなと
438 :
名無しさん@停滞中 ★
: 10/03/19 19:45:51 ID:???
http://threadic.com/thread/bbs/read.php/japanese/1267451067/72
うほっ
出来たですっ
ありがとうございます
そうか、こういう時に$VIEWERを使うのかと。
ただ ケアレスミスでしょうけど「w」ではなく「\w」ではないかと。
http://image.threadic.com/images/(?:w+)
[Tab]$&[Tab][Tab]$VIEWER
↓
http://image.threadic.com/images/(?:
\w+)[Tab]$&[Tab][Tab]$VIEWER
あと、グループ処理(?何ていうんだろう・・「(?:〜)」というやつ)を使った理由がわからなくて悩んでるです
いえ別にいいんです
失礼しました
ごめんなさい
439 :
名無しさん@停滞中 ★
: 10/03/19 23:08:57 ID:???
>>411
実装(カッケー!)
440 :
名無しさん@停滞中 ★
: 10/03/19 23:22:11 ID:???
補足しとくと
http://adult.threadic.com/thread/bbs/read.php/pervertplus/Cushion/http://www.geocities.jp/mirrorhenkan/
とかからアクセスしてきたらメッセージを出すようにしただけ
ついでに
http://tieba.baidu.com/f?kz=635797320
とかからアクセスがあったら別のメッセージを出すようにしてみたり
まあ大半の方々には関係無いような事で
無意味といわれても別に
441 :
名無しさん@停滞中 ★
: 10/03/20 12:07:55 ID:???
メモ
2ちゃんぬる(
http://2chnull.info/
)のdat化について
URL例
http://2chnull.info/r/gline/1165245437/1-1001
正規表現
m#<dt>([0-9]+):<em><b>(?:<a href="mailto:(.+?)">)?(.+?)(?:</a>)?</b></em>:(.+?)</dt>\t+<dd>(.+?)</dd>#mik
前処理
s#<title.+?/title>##ik
s#<div id="body">\s+<h2>(.+?)</h2>#<title>$1</title>#ik
s#<a.+?>(h?ttp://\w+?\.(?:2ch\.net|bbspink\.com)/test/read.cgi/\w+?/\d+/?)</a> \[<a href=".+?">cache</a>\]#$1#igk
URL例の場合だと例えばレス3の7行目以降が省略されてるみたい
(元レスは
http://society6.2ch.net/test/read.cgi/gline/1165245437/3
)
どういう法則で省略になったのか判りませんが、そういう事があるかもしれないという事で。
442 :
名無しさん@停滞中 ★
: 10/03/20 12:32:13 ID:???
メモ
2chまとめサイトエディター2.0
http://eva-lu-ator.net/~gemma/ktkr2/bbsmenu.html
やったー2chまとめサイトエディター2.0できたよー\(^o^)/ - Gemmaの日記
http://d.hatena.ne.jp/Gemma/20100317/1268812937
443 :
名無しさん@停滞中 ★
: 10/03/21 20:05:32 ID:???
http://threadic.com/thread/bbs/read.php/japanese/1269082122/
上を見て
http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/
を板登録しようとしたらうまくいかないです
とりあえずsubbackの取得先が違うような
元
http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/subback/
xeno
http://be.threadic.com/thread/bbs/read.php/bbs-jp/subback/
444 :
名無しさん@停滞中 ★
: 10/03/21 20:11:00 ID:???
「bbs」が「bbs-jp」になってるみたい
あと
レス欠番するようにもなってるみたい
下の9・15・17・以下沢山
http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/1269087909/
445 :
koreawatcher
◆Nida.eneRA
: 10/03/21 22:22:28 ID:KAywHbp7
>>437
の辺りからここに投稿しようとしてもうまく行かず、IPアドレスを変えてみたら
書き込めるようになったんですが、偶然でしょうか。
それはおいといて、
>>438
は「\w」ですね。コピペ元も「\w」になっていたのに
なぜそのように投稿してしまったのか謎です。
(?: は$1に結果を格納しないから無駄がなくなるという程度に
理解しています。もしかしたら間違っているかもしれませんが。
>>443
read.phpの前にはbbsが来るという前提でプログラムが作られているので
変更が必要になりますね。
今は、ホスト=threadic.com/thread、板=japaneseとやっていますが、
ホスト=threadic.com/thread/bbs、板=japaneseと変更しなければ
ならない気がします。
446 :
名無しさん@停滞中 ★
: 10/03/22 20:14:46 ID:???
>>445
すみません、スパムがひどいので「http://」をNGワードにしてあるです。ごめんなさい
yykakikoだと、NGワード交じりの文章でも投稿後「投稿完了しました」メッセージが出るみたいで
多分それなのではないかなと思うのですが。
とりあえず「http://」をNGから外してみたです(スパム来るかな)
それはそうと、threadic.comさんの所
htmlがこれまた全然様変わりしてるですね。
今日の昼頃まではXenoでdat化取得出来たのですが
現在ではさっぱりです
レス番も盛大に飛びまくってますし。
たぶんsubbackのhtmlも変わってるのだろうなと。
URL例
http://threadic.com/thread/bbs/read.php/japanese/1268644780/
http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/1269087909/
正規表現
m#<DT>([0-9]+).*?:(?:<font.+?>|<SPAN ID="G">|<a href="mailto:(.+?)">)<b><B>(.+?)</B></b>(?:</SP
AN>|</font>|</a>)? *?:(.+?)(?:<BR>)?<DD>(.+?)<BR><BR>#mi
前処理
s#(<b><B>.+?</B>)( ◆.+?)</b>((?:</font>|</span>))#$1$2<B></b></b>$3#ig
ホストと板に含める範囲もですが、
>>432-433
の件もあり
やはり簡易的な正規表現置換機能があったら有難いなと思う次第です
447 :
名無しさん@停滞中 ★
: 10/03/23 07:48:43 ID:???
あれれ
上のやつだと下のhtml等でトリップ周りがうまく切り分けられないのか
難しい
http://threadic.com/thread/bbs/read.php/japanese/1269082122/
448 :
名無しさん@停滞中 ★
: 10/03/23 18:39:25 ID:???
ほんとコロコロ変わる
m#<dt>([0-9]+) .+?:(?:<font.+?>|<a href="mailto:(.+?)">)<B>(.+?)</B>(?:</font>|</a>) :(.+?)<dd>(.+?)<BR><BR>#mi
449 :
名無しさん@停滞中 ★
: 10/03/25 18:33:07 ID:???
さて、まだホスト規制されてるですし
長文で尚且つ2chではない所に関する事なのでここで
http://pc12.2ch.net/test/read.cgi/software/1267177119/390
何だかうまくいかないです。
いったん板削除してから板追加したのですが
subbackからして404NotFoundになるです。
どうも指定先が違うみたいに思うのですが。
元
http://threadic.com/thread/bbs/read.php/japanese/subback/
Xeno
http://threadic.com/thread/bbs/bbs/read.php/japanese/subback/
元
http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/subback/
Xeno
http://be.threadic.com/thread/bbs-jp/bbs/read.php/koreajapan/subback/
なのでJane2ch.brdを開いて
ホスト=threadic.com/thread/bbs 板=japaneseとなっている箇所を
ホスト=threadic.com/thread/板=japaneseと変更したらsubbackにアクセス出来たです
450 :
名無しさん@停滞中 ★
: 10/03/25 18:51:13 ID:???
次にhtmlの形態ですが
japanese板とkoreajapan板とで全然違うものになっているような。
とりあえずjapanese板のほうはxenoで該当スレッドのhtmlにアクセスしてるようですけど
dat化取得出来ない感じです。
(1)
http://threadic.com/thread/bbs/read.php/japanese/
(2)
http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/
(1)URL例
http://threadic.com/thread/bbs/read.php/japanese/1269465598/
正規表現
m#<dt>([0-9]+).*?:(?:<font color=green>|<a href="mailto:(.+?)"><b>)<B>(.+?)</B>(?:</font>|</a>) +:(.+?)<dd>(.+)<BR><BR>#mi
前処理
s#(</b> *)(◆.*?)(?:</b>)?((?:</font>|</a>))#$1$2<B></B>$3#ig
(2)URL例
http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/1269258316/
正規表現
m#<dt>([0-9]+).*?:(?:<font.+?>|<SPAN ID="G">|<a href="mailto:(.+?)">)<b><B>(.+?)(?:</B>)?</b>(?:</SP
AN>|</font>|</a>) *?:(.+?)<DD>(.+?)<BR><BR>#mi
前処理
s#(</b> *)(◆.*?)(?:</b>)?((?:</font>|</a>))#$1$2<B></B>$3#ig
どちらにおいても透明あぼーんがあるので
それを補う必要もありそう
451 :
名無しさん@停滞中 ★
: 10/03/25 18:57:48 ID:???
で、
>>450
のどちらの板のhtmlにも対応するような正規表現を考えると
次のようなものになるかも。
threadic.comの管理人さんが更新したらまた使えなくなるかもですが
URL例
http://be.threadic.com/thread/bbs-jp/read.php/koreajapan/1269258316/
http://threadic.com/thread/bbs/read.php/japanese/1269465598/
正規表現
m#<dt>([0-9]+).*?[::](?:<font.+?>|<SPAN ID="G">|<a href="mailto:(.+?)">)(?:<b>)?<B>(.+?)(?:</B>)?</b>(?:</SP
AN>|</font>|</a>) *?:(.+?)<DD>(.+?)(<BR><BR><dt>)#mi
前処理
s#(</b> *)(◆.*?)(?:</b>)?((?:</font>|</a>))#$1$2<B></B>$3#ig
ここまで書いて思ったですけど
「読めないぞ」という反応が皆無というのは
もしかして読めないのは自分だけなのかもしれないのかな・・
よくわかんないです
452 :
koreawatcher
◆Nida.eneRA
: 10/03/25 19:12:51 ID:bqIcWF5D
>>449
brdconf.iniでBBSType=Sch_BBSなどの記述があれば削除してください。
すでにThreadicとSchは別物として処理しているので、Threadicを
Schであると指定すると不具合が起こります。
453 :
名無しさん@停滞中 ★
: 10/03/25 19:26:17 ID:???
うお!!!
>>452
それでした!
削除したら読めたです!
ありがとうございます!
# うー恥ずかしい・・・
454 :
名無しさん@停滞中 ★
: 10/03/26 19:04:05 ID:???
メモ
2ch_log
http://wmotenailog.x.fc2.com/
455 :
名無しさん@停滞中 ★
: 10/03/29 19:24:59 ID:???
メモ
インスパイヤw - なんとなく◎(
http://sunos.saita.ma/inspired/
)のdat化について
URL例
http://sunos.saita.ma/inspired/?dubai+actor+1230881341
正規表現
m#<dt>([0-9]+) :(?:<span>|<a href="mailto:(.+?)">)<b>(.+?)</b>(?:</span>|</a>\[.+?\]):(.+?)</dt><dd> (.+?)</dd>#mik
前処理
s#(<title>.+?) - インスパイヤw - なんとなく◎(</title>)#$1$2#ik
s#<br />#<br>#igk
元スレ(
http://dubai.2ch.net/test/read.cgi/actor/1230881341
)が消えているのに
何故か読めるので。
追加するとしたら「その77」になるのかな
ところで、xhtmlでの改行タグは「<br />」みたいなんでいちおう置換するようにしたですが
これって「<br>」にしなくても専用ブラウザ的(?)にはOKなんでしょうか。
456 :
名無しさん@停滞中 ★
: 10/04/01 18:52:42 ID:???
上のdat化処理ですが
「<br />」→「<br>」に全置換するのは後処理のほうが効率的ですね。
前処理でやると、dat化に必要な部分以外の「<br />」も置換する事になる訳で
時間と電気代とCPU計算その他の消費が冗長になるのではないかと思われ
まあいいか
ところで
2chで落ちた意見を蘇生する方法 | web R25
http://r25.yahoo.co.jp/fushigi/jikenbo_detail/?id=20100324-00001841-r25&vos=nr25mn0000001
そこまで採り上げるほどの記事なんかなと
457 :
名無しさん@停滞中 ★
: 10/04/02 12:19:42 ID:???
メモ
みんくちゃんねるログ(
http://log.minkch.com/
)のdat化について
URL例
http://log.minkch.com/read.php/801/1267194035/
正規表現
m#<dt.*?>([0-9]+) : <span class="nam">(.+?)</span>\[(.*?)\] : (.+?) </dt><dd>(.+?)<br /> <br /></dd>#mik
前処理
s#<title.+?/title>##ik
s#<h2>(.+?)</h2>#<title>$1</title>#ik
s#(<span class="nam">.+?)</span><span style="color:green;">(◆.+?)</span>#$1</b>$2<b></span>#igk
s#</?(?:div|script|li|select|option).+?(?=\n)##igk
変換結果式
$2<>$3<>$4<>$5<> (←メール欄逆転)
後処理
s#<br />#<br>#igk
458 :
名無しさん@停滞中 ★
: 10/04/02 12:42:24 ID:???
>>457
の正規表現って
よく見たら
>>315
と同じっぽいですね。
ミラー対象の板も似てるですし
もしかしたら同じ方がやっておられるのかも
459 :
名無しさん@停滞中 ★
: 10/04/02 19:10:07 ID:???
とか書いたあとでみてみたら
http://p.loface.com/
http://ch.xmoe.jp/
にアクセスすると
http://news.minkch.com/
に飛ぶですね。
同じ方ですか。
460 :
名無しさん@停滞中 ★
: 10/04/02 19:15:41 ID:???
メモ
z-z-z-z.net 2chブラウザ(
http://z-z-z-z.net/
)のdat化について
URL例
http://z-z-z-z.net/b/society6.2ch.net/gline/1165245437/
正規表現
m#<dt>([0-9]+)\.<a href=mailto:(.*?)>(.+?)</a>(.+?)</dt><dd>(.+?)<br>(<a name=\d+></a>)#mik
前処理
s#(<a href=mailto:.*?>.*?)(◆.+?)(</a>)#$1</b>$2<b>$3#igk
461 :
名無しさん@停滞中 ★
: 10/04/02 19:22:56 ID:???
ところで
>>460
の正規表現なのですが
最初
m#<a name=\d+></a><dt>([0-9]+)\.<a href=mailto:(.*?)>(.+?)</a>(.+?)</dt><dd>(.+?)<br>(<a name=\d+></a><dt>)#mik
とやったらレスが一つ飛びになってしまいうまくいかなかったです。
なので頭と$6の部分を少し変えたのですが、
上の正規表現のどこがまずいのかよくわからない。
実際、どこがいけないのでしょう?
462 :
◆/vmukiyuzw
: 10/04/03 03:16:05 ID:b9qEg+OM
>>461
ご迷惑おかけします。
htmltodatサポスレのほうでレスさせていただきました。
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/602
463 :
名無しさん@停滞中 ★
: 10/04/04 09:54:42 ID:???
>>463
ありがとうございます。そういう事だったんですか。
という事は、現状ではレスアンカーが要になっている場合は前処理等で何か手心が必要になる訳ですね。
上の場合は<dt>があったのでその辺は何とかなったですが。
というか、
>>460
だと最終レスがマッチしなかったですね。
まだまだ修行が必要だ
464 :
名無しさん@停滞中 ★
: 10/04/04 09:56:51 ID:???
メモ
z-z-z-z.net 2chブラウザ(
http://z-z-z-z.net/
)のdat化について
URL例
http://z-z-z-z.net/b/society6.2ch.net/gline/1165245437/
正規表現
m#<dt>([0-9]+)\.<a href=mailto:(.*?)>(.+?)</a>(.+?)</dt><dd>(.+?)<br>(<a name=\d+></a>|</dl>)#mik
前処理
s#(<a href=mailto:.*?>.*?)(◆.+?)(</a>)#$1</b>$2<b>$3#igk
>>460
では最終レスの取りこぼしがあったので。
465 :
名無しさん@停滞中 ★
: 10/04/04 10:17:52 ID:???
がっくしメニューはどうかな
dat落ちしてもしばらく読めたら面白いですけど
http://orz4.2ch.io/orz/orz.cgi/*/yutori7.2ch.net/news4vip/1270340527/1-1001
http://orz4.2ch.io/orz/orz.cgi/*/anchorage.2ch.net/musicjg/1267157656/1-1001
466 :
名無しさん@停滞中 ★
: 10/04/05 20:57:45 ID:???
駄目でしたか
いえいいんです
メモ
CSS切り替えJavaScript
http://act.st/etc/css_ss.htm
467 :
名無しさん@停滞中 ★
: 10/04/05 21:00:40 ID:???
外部CSSの切り替え
http://www.din.or.jp/~hagi3/JavaScript/JSTips/Std/csschg.htm
468 :
名無しさん@停滞中 ★
: 10/04/08 18:15:42 ID:???
メモ
何か開発するブログ 「2ちゃんねる全文検索」を公開しました
http://blog.livedoor.jp/slx/archives/51811689.html
2ちゃんねる全文検索
http://app.xrea.jp/search2ch/
469 :
名無しさん@停滞中 ★
: 10/04/08 18:21:37 ID:???
2chセンブラーONLINE(ββ)
http://fatalita.sakura.ne.jp/CGI/2ch/index.html
>>435
の方のサイトですが(
http://victreal.com/
がメインになるかもだそうですが)
それはそれとして
http://fatalita.sakura.ne.jp/CGI/2ch/index.html?text1=http%3A%2F%2Fyutori7.2ch.net%2Ftest%2Fread.cgi%2Fnews4vip%2F1270472109%2F
上のURLが
http://yutori7.2ch.net/test/read.cgi/news4vip/1270472109/
がdat落ちしても閲覧可能だったら
どんなにか嬉しい事でしょうか。
470 :
名無しさん@停滞中 ★
: 10/04/15 19:34:27 ID:???
W2Ch DAT変換機
http://2chdat.soprano-asm.net/
> まぁ
http://yellow.ribbon.to/~mirror/
の"url.php"を改変してURLをうんぬんしたり
> 0chのread.cgiをいじってログを見れるようにしたりでw
のけぞったです
検索結果を見て更に海老反りました
結果
http://2chdat.soprano-asm.net/url.php?url=http%3A%2F%2Ftsushima.2ch.net/test/read.cgi/news/1270045997/
閲覧
http://yellow.ribbon.to/~mirror/dat2html/read1.php?url=http://2chdat.soprano-asm.net/2ch.net/news/1270/1270045997.dat
ログ
http://2chdat.soprano-asm.net/2ch.net/news/1270/1270045997.dat
よくわからないですけど、o2onとも連動しておられるみたいで。
後で追加してみるです。「その80」になるのかな。その代わり「その29の17」は不通になってますね。
あと他のW2Ch中間サーバもバージョンアップ等で軒並みURL構造が変わっている予感です
こういうのがあると、ソース(
http://yellow.ribbon.to/~mirror/url.php.txt
)出しといて良かったなと。
こんなの誰が見るんだ初心者ソースに突っ込まれるだけ損じゃないかとか思ってたですが。
ってこれ出してもう5年経つんですか。
471 :
名無しさん@停滞中 ★
: 10/04/16 19:47:58 ID:???
メモ
web2ch.org(
http://web2ch.org/
)のdat化について
URL例
http://web2ch.org/PHP/av.php/society6.2ch.net/gline/1165245437/
http://web2ch.org/PHP/av.php/pc12.2ch.net/streaming/1240594588/
正規表現
m#<div.+?><p.+?>([0-9]+) (.+?)\=\=(.*?)\=\=(.+?) </p><p class=mg> (.*?) </p></div>#mik
前処理
s#(<title.+?) \- web2ch\.org\(2chブラウザ\)(</title>)#$1$2#ik
//s#(<div)#\n$1#igk
変換結果式
$2<>$3<>$4<>$5<> (←メール欄逆転)
後処理
s#((?:^|\n).*?)(◆.+?)<>#$1</b>$2<b><>#igk
ソースが改行なしにベターっと出るタイプなので前処理2番目をつけようとしたですが
つけなくてもOKっぽいのでコメントアウトしてるです
472 :
名無しさん@停滞中 ★
: 10/04/16 19:49:16 ID:???
>>471
補足
ここ公開したてのホヤホヤみたい。
スレッドは下記
web上から2chを見られるビューアweb2ch.org
http://pc12.2ch.net/test/read.cgi/software/1271203705/
上のスレッドの10で
> dat落ちしたスレでもdat落ち前のキャッシュがあれば●がなくてもキャッシュの表示可能。
との事なので、後日追加させてもらおうかなと思うです
「その81」になるのかな
473 :
名無しさん@停滞中 ★
: 10/04/17 12:59:29 ID:???
メモ
やるにょ(
http://www.yarunyo.com/
)のdat化について
URL例
http://www.yarunyo.com/kakolog/gline/1165245437/
正規表現(長すぎるので2行に分けてます)
m#<a name=".+?">([0-9]+)</a> 名前:<span class="green"><b>(?:<a href="(.+?)" rel="nof
ollow">)?(.+?)(?:</a>)?</b></span>投稿日:(.+?)<blockquote>(.+?)</blockquote>#mik
前処理
s#<title.+?/title>##ik
s#<h1>(.+?)</h1>#<title>$1</title>#ik
//s#\n<a href.+?(?:\n)##igk
これでdat化出来ますが、dat化直後に「一行が長すぎるか〜」エラーが出るです。
対処するために前処理3番目をつけたら「fatal error」と出たりhtmltodat自体が落ちたりするのでコメントアウトしたです
このエラーが自分の環境でだけ起こるかどうかわかりませんが
汎用的(?)に発生するならまあそういうエラーが起こるという事で。
474 :
名無しさん@停滞中 ★
: 10/04/17 14:16:14 ID:???
>>473
fatal error 又はhtmltodat自体が落ちる件 自分の環境でだけなのかもしれないですね。
自分とこでは再起動したりしてやってみても同じ結果でしたが。
あとtypo
s#\n<a href.+?(?:\n)##igk
↓
s#\n<a href.+?(?=\n)##igk
それと
http://pc12.2ch.net/test/read.cgi/software/1271203705/12
http://society6.2ch.net/test/read.cgi/gline/1165245437/662
自分とこだと、例えば誰かの検索したスレッドURLがタイムリーに出るようにしてありますが
んもう検索結果がやたら大量なので(少ない時でも5秒に1度くらい?)
もはや全然気にする事はないんじゃないかと。
自分が検索したスレッドURLで嗜好がバレる云々とかそういうのも
考え過ぎなのではないかと思うです (てか自分が考え過ぎか?)
検索結果のURLもすぐ流れてしまいますし。
そういう事ではないのかな?
違っていたとしても別にどうでもいいんですが。
475 :
名無しさん@停滞中 ★
: 10/04/17 16:18:31 ID:???
>>473
それだけではなく
ソースの「<h2>2ch過去ログカテゴリ</h2>」から始まる行もネックみたい。
700強ある板名とリンクが改行なしで並んでいるみたいなので。
476 :
名無しさん@停滞中 ★
: 10/04/17 16:25:31 ID:???
http://bbs.yaroze.jp/tantanyakisoba/
http://bbs.yaroze.jp/ye/read.cgi/costco/1092143769/13
http://www.yaroze.jp/i18n/
掲示板下部に
> 0ch BBS 2007-01-24改UTF8(2008-02-02)
とありますが、ソースを見たら自分とこのとは別物みたい。
例えば「Charset="UTF-8"」のUTF-8が小文字になっていたり
その他細かい箇所でも色々と。
ところで
http://yy14.kakiko.com/test/read.cgi/mirror/1014655362/862-871n
ごめんなさいごめんなさい
もう一年経つですか
477 :
名無しさん@停滞中 ★
: 10/04/18 13:16:09 ID:???
メモ
■■速報自動保管庫■■
http://sag.uzo.in/
478 :
◆/vmukiyuzw
: 10/04/19 03:35:13 ID:ZXTymH+7
>>473
レスデータの前でなく後ににガラガラが付いているので、dat変換は成功するのに
その後ろを変換しに行ってエラーになってるようですね。
とりあえず前処理の3つめを
s#\| <a href.+?</a>##igk
としてやるとエラーは取れるようです。
あと「fatal error」はBREGEXP.DLLが出してるエラーで
まずい(どういうのがと言われると困ってしまうのですが)正規表現を書いてしまうと
割と簡単に出てしまいます。
いったん出てしまうとメモリの状態がおかしくなっている可能性が高いので、
続けて使うとhtmltodatが落ちてしまうのもそれが原因です。
これは現状、正規表現の解析・実行をBREGEXP.DLLに投げっぱなしにしている以上
どうしようもない仕様と言わざるを得ないところです。まことに申し訳ないのですが
そういうもんだと割り切って使っていただくしかないです。
479 :
名無しさん@停滞中 ★
: 10/04/19 18:23:00 ID:???
>>478
ありがとうございます。
という事は、
>>475
で引っ掛かっていたのですね。
他の行は削らなくても良かったのでしたか。
とりあえず、「| <a href」だと本文中にもありそうなので
s#\| <a href="/kakolog/.+?</a>##igk
とやったら何とかなったのかもです
という事で「その80」〜「その82」まで追加
JavaScriptでのミラー変換速度はまだまだ大丈夫そう
480 :
名無しさん@停滞中 ★
: 10/04/19 18:47:41 ID:???
メモ
よくまとめてあるなーと
実況ニューサロ: 実況板過去ログを効果的に漁る方法
http://jikkyonews.blog109.fc2.com/blog-entry-81.html
481 :
名無しさん@停滞中 ★
: 10/04/20 17:48:07 ID:???
2ちゃんねる一発検索
http://2ch.webcross01.com/
482 :
名無しさん@停滞中 ★
: 10/04/20 18:31:50 ID:???
2chニュースポータル
http://2chtimes.com/
http://2chtimes.com/th.php?sv=society6.2ch.net&b=gline&dat=1165245437
http://2chtimes.com/th.php?sv=tsushima.2ch.net&b=newsplus&dat=1271720084
上ですが
http://tsushima.2ch.net/test/read.cgi/newsplus/1271720084/
がdat落ちしても読み込めたらどんなにか面白い事でしょうか。
ちなみにこのhtmlソース、本文とポップアップするものが全く同一になってるっぽくて
dat化が少し厄介そうな気がするです
483 :
名無しさん@停滞中 ★
: 10/04/20 19:02:16 ID:???
一応やりかけ
2chニュースポータル(
http://2chtimes.com/
)のdat化について
URL例
http://2chtimes.com/th.php?sv=tsushima.2ch.net&b=newsplus&dat=1271720084
http://mirror.sarashi.com/htmltodat/1271720084.html
正規表現(長いので2行に分けて)
m#<span class="ch2_thread_count">([0-9]+)</span>&n?bsp;<span class="ch2_thread_name">()(.+?)</sp
an>&n?bsp;<span class="ch2_thread_datetime">(.+?)</span><div class="ch2_thread_body">(.+?)</div>#mik
前処理
s#<script[\S\s]+?/script>##igk
s#<div id="pop[\S\s]+?</div>\s+</div>##igk
s#(span class="ch2_thread_name">.*?)(◆.+?)(?:(@.+?))?(</span>)#$1</b>$2<b>$3$4#igk
スレッドタイトルとメール欄がないですが
一応、上で出したURL例のものだとこれでdat化出来るです。
ただし、下のはレス 14-17 の間 と レス 30-36 の間が飛んでしまいます
ちょっと今体調不良につき よく考えられなんだ
http://2chtimes.com/th.php?sv=society6.2ch.net&b=gline&dat=1165245437
484 :
名無しさん@停滞中 ★
: 10/04/21 08:20:24 ID:???
駄目でしたか
いえ別にいいんです
引っ掛かったままだと気持ち悪いので
メモしとくです
とりあえず2chニュースポータル(
http://2chtimes.com/
)のdat化について
URL例
http://2chtimes.com/th.php?sv=society6.2ch.net&b=gline&dat=1165245437
http://mirror.sarashi.com/htmltodat/2chtimes/1165245437.html
正規表現
m#<span class="ch2_thread_count">([0-9]+)</span>&n?bsp;<span class="ch2_thread_name">()(.+?)</spa
n>&n?bsp;<span class="ch2_thread_datetime">(.+?)</span><div class="ch2_thread_body">(.+?)</div>#mik
前処理
s#<div id="pop.+?>\s+\[レス番が見当たりません\]</div>##igk
s#<div id="pop[\S\s]+?</div>\s+</div>##igk
s#(span class="ch2_thread_name">.*?)(◆.+?)(?:(@.+?))?(</span>)#$1</b>$2<b>$3$4#igk
485 :
名無しさん@停滞中 ★
: 10/04/21 19:11:11 ID:???
メモ
2chビューアーD(
http://2ch.uda2.com/
)のdat化について
URL例
http://2ch.uda2.com/society6-gline/1165245437/
正規表現
m#<dt.+?><a name=".+?"></a>([0-9]+) <span>(.+?)</span>(.*?)((?:\d{2}|\d{4})/\d+/.+?)</dt><dd>(.+?)</dd>#mik
前処理
s#\n<tr>.+?</tr>##igk
s#<script[\S\s]+?/script>##igk
s#<title.+?/title>##ik
s#<h5>(.+?)\(\d+\)<span>#<title>$1</title>#ik
s#\n<a href="
http://2ch.uda2.com.+?>.+?</a><br/>##igk
変換結果式
$2<>$3<>$4<>$5<> (←メール欄逆転)
「透明あぼーんを補う」にチェック
モノによってはメール欄と日付の切り分けがうまくいかないかも。
エイプリルフール仕様の日付なんかあったらひとたまりもありません
486 :
名無しさん@停滞中 ★
: 10/04/21 19:24:28 ID:???
>>485
補足
>>385-386
でも触れた所ですが
その時は確かdat落ち後は読めなかったような記憶があるです。
で、久しぶりに巡回してみたら
> 各表示はキャッシュされて表示されますのでDAT落ちしたスレッドが読めるかもしれませんが
> 速報系の掲示板は苦手です(板一覧:週一、スレッド一覧:1時間、スレッド内容:15分)
とありましたので。
あと下のとか。
http://uda2.com/blog/tag/2ch/
http://uda2.com/blog/2010/01/%E3%82%B3%E3%83%B3%E3%83%86%E3%83%B3%E3%83%84%E3%81%AE%E8%A6%8B%E7%9B%B4%E3%81%97/
現在、CORE SERVER(CORE-A)を使っておられるとの事なので
15GBまでデータ蓄積出来るみたい↓
http://www.coreserver.jp/?ref=uda2
487 :
名無しさん@停滞中 ★
: 10/04/21 19:53:15 ID:???
>>485
後処理を転記し忘れたです
後処理
s#<br />#<br>#igk
s#((?:^|\n).*?)(◆.+?)(?:(@.+?))?<>#$1</b>$2<b>$3<>#igk
488 :
名無しさん@停滞中 ★
: 10/04/24 17:35:13 ID:???
メモ
【Python Django】で2ch検索 - オラオラ検索
http://pc11.2ch.net/test/read.cgi/php/1202196045/
489 :
名無しさん@停滞中 ★
: 10/04/24 19:17:58 ID:???
実況ニューサロ: いつでも過去ログが見れる「2chログキャッシュ」を作りました
http://jikkyonews.blog109.fc2.com/blog-entry-13.html
実況ニュースサロン 2chログキャッシュ01
http://yy54.60.kg/newsalog01/
実況ニュースサロン 2chログキャッシュ02
http://yy55.60.kg/newsalog02/
chohnanの日記
http://d.hatena.ne.jp/chohnan/
490 :
名無しさん@停滞中 ★
: 10/04/24 19:19:36 ID:???
[を]2ちゃんねるキャッシュ検索
http://chalow.net/2007-03-28-1.html
491 :
名無しさん@停滞中 ★
: 10/04/29 21:33:01 ID:???
ぴーちゃんねる
http://pchannel.net/
http://banba.jp/
採り上げているスレッドの量が物凄いんですが
自動でやっているのか手動なのか気になるです
完全自動だったら各レスの色分けとか画像取得置き換えの問題をクリアされてるんでしょうし
半手動だとしても毎日毎日の量が半端ではない数な感じがしますし。
492 :
名無しさん@停滞中 ★
: 10/04/29 21:44:01 ID:???
よくわからないですが
これ↓も同じページが表示されるです
http://suzuke.jp/
http://218.219.148.59/
493 :
名無しさん@停滞中 ★
: 10/04/30 19:01:02 ID:???
>>435
>>469
の方ですが
GoogleChromeアドオンでもやっちゃってくれてますね。
http://fatalita.sakura.ne.jp/Download/g2chDat/
自分とこのリンクがどこにも見当たらないです。
いっそ、「url.html」を別の名前にしてみるのも一興ですな。
まあ
>>470
のサイトやJaneの外部コマンド登録とかしてる人に影響あるでしょうけど。
こういう事やるならやるで
下のとか dat落ち後も読めるようにして頂けないですかね。
2chセンブラーONLINE(ββ)
http://fatalita.sakura.ne.jp/CGI/2ch/index.html
保存容量云々とかいうなら
cron使って一週間だけ保持しとくとか出来るでしょうに。
(というか さくらインターネットってデフォルトでcron使えるんですかね?)
FireFoxやChromeのアドオン拵えられるスキルがあるなら簡単でしょう。
[改行]
・・・代弁してくれてる方がいらっしゃいました。ありがとうございます
選択したテキストを指定したURLに渡すアドオンについて - SASAMI STREET
http://d.hatena.ne.jp/sasamistreet/20100317/nankazurui
(続)選択したテキストを指定したURLに渡すアドオンについて - SASAMI STREET
http://d.hatena.ne.jp/sasamistreet/20100430/renankazurui
494 :
名無しさん@停滞中 ★
: 10/05/01 17:51:52 ID:???
まだ断定は出来ないですけど
どうもコピペした際に、ブラウザによっては半角スペースが付く場合があるみたい。
http://yy14.kakiko.com/test/read.cgi/mirror/1014655362/876
上のURLなんですが、自分の環境だと
コピペしてみるとIEとFirefoxで違う結果を出してしまうみたい。
正規表現をコピペすると、IEではなんでもないんですが
Firefoxでコピペしたものだとマッチしなくなるです。
調べてみると、「\[(.*?) \]」のように
「\]」の前に半角スペースがついてしまうようで。
IE6でコピペ
m#<dt.*?>([0-9]+) :<span.*?>(?:<b>)?(.+?)(?:</b>)?</span>\[(.*?)\]:(.+?)</dt><dd.*?> ?(.+?)(?:<script|</dd>)#mik
Firefox3.0.6でコピペ
m#<dt.*?>([0-9]+) :<span.*?>(?:<b>)?(.+?)(?:</b>)?</span>\[(.*?) \]:(.+?)</dt><dd.*?> ?(.+?)(?:<script|</dd>)#mik
自分の環境だと、再起動してやってみても同じ結果でした。
問題はこれが自分とこだけの事なのかどうか。
検索しても同様の症状が出てこないので心配になるです
495 :
名無しさん@停滞中 ★
: 10/05/02 18:52:07 ID:???
imona.netさん
いつの間にかweb読みを復活されたのですか
http://imona.net/dat.pl/r/society6.2ch.net/test/read.cgi/gline/1165245437/
496 :
名無しさん@停滞中 ★
: 10/05/04 14:33:59 ID:???
>>327
でやってたものをメニューに追加してみたです
0chスクリプトQRコード化
http://www7.atpages.jp/mirrorhenkan0/qr0ch/
半年以上前にやってそれっきりだったので
どこをどうしたとかすっかり記憶の彼方ですが
成果物を出しといたほうがいいよなと
497 :
名無しさん@停滞中 ★
: 10/05/04 17:45:59 ID:???
とやってからソース見てみたら
何とも効率の良くない事やってるなーと。
あとデータ渡しにQuery_String使ってるっぽいので
ブラウザによっては表示出来なくなっているかも。
またPerl思い出すの厄介だなぁ・・
498 :
名無しさん@停滞中 ★
: 10/05/06 22:49:51 ID:???
メモ
HikkyWeb 2chブラウザ Version(1.9.2)
http://www.hikkyweb.jp/
http://www.hikkyweb.jp/GetThreadDAT.aspx?URL=http://yutori7.2ch.net/news4vip/&DAT=1273048934.dat
上ですが
http://yutori7.2ch.net/test/read.cgi/news4vip/1273048934/
がdat落ちしても閲覧出来たら
どんなにか嬉しい事でしょうか。
499 :
名無しさん@停滞中 ★
: 10/05/15 09:05:32 ID:???
http://pc12.2ch.net/test/read.cgi/software/1267177119/830
> ・Threadic掲示板関連の修正(スレの取得をofflaw.cgiに変更など)
offlaw.cgiよりもdatread.cgiを読み込んだほうがいいのではと思ったですけど
もしかしたらofflaw.cgiで出ているレス番をキーにしているのかなと思ったですが
所詮素人考えなので以下略
offlaw.cgi
http://threadic.com/thread/bbs/offlaw.cgi/bugreport/1273812769/
datread.cgi
http://threadic.com/thread/bbs/datread.cgi/bugreport/1273812769/
ところでthreadic.comの管理人さんもtwitter始めておられたですね。
プロフィールの現在地を見てあれれどういう方なのかなと思ったり。
http://twitter.com/miyako2_engine/
500 :
koreawatcher
◆Nida.eneRA
: 10/05/15 18:14:15 ID:PgRxx5jJ
>>499
datread.cgiの存在をどこで知りました?
offlaw.cgiに関しては、offlaw.cgiを作ってくれというメール(モデルはまちBBS)
をThreadicの開発陣に送ったからなんですが、datread.cgiに関しては初耳です。
ThreadicのCGIの最大の問題点は透明あぼーんの扱いで、offlaw.cgiでは
例えば2があぼーんされていれば1の次が3になっていますが、datread.cgiでは
2があった痕跡すらありません。
スレ一覧やレスの表示でこれらの矛盾が放置されたままになっています。
501 :
名無しさん@停滞中 ★
: 10/05/15 19:07:06 ID:???
>>500
例えば
http://be.threadic.com/thread/bbs-jp/read.cgi/koreajapan/
↑を、IE等のブラウザで開いて
タイトル右にある「read.cgi ?? ??」(←この板では文字化けしますが)をクリックして
ダイアログが出てOKしてから各スレッドを読み込むとread.jsモードになるです。
そこで読み込んでいるdat代わりのものががdatread.cgiで、そこで知ったです。
で、確かにレス番欠如のものは詰めて表示されているですね。
これではofflaw.cgiのほうしか使えないですね。
以下蛇足の独り言
このread.jsって、2chの流用じゃないですか。
read.htmlにしても行数までぴったり合っているし。
外部jsもざっと見てみましたが、ほぼ同じ。
[threadic.com]
http://be.threadic.com/thread/bbs-jp/js/index.js
http://be.threadic.com/thread/bbs-jp/js/read.js
↓
[2ch]
http://www2.2ch.net/snow/index.js
http://www2.2ch.net/snow/read.js
自分も
http://mirror.s151.xrea.com/0ch_html/
や
http://mirrorhenkan.hp.infoseek.co.jp/0ch_html/
をやった事がありますが
read.jsの作者リンク(
http://sunos.saita.ma/2ch-cgi-lw.htm
)を変える事なんか
これっぽっちも思いもしませんでしたよ。
なんで作者表示まで変えたのかなー。
丸パクリじゃないですか。
ずるい。
ここまで2chのスクリプトソースを流用しているというのに
twitterでの↓この発言はどういう事なのかと。(twitterリンクはthreadic.comの板の最下部にあります)
http://twitter.com/miyako2_engine/status/13130287300
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
ジョンジョンスレディックが2chソース盗んで書いたとしている場合がありますが、2chのソースコードは公開されていな
いため、事実上のドロップの書き込みができないだけでなく、エンジンの見た目が似ているが、内部的にも、同じだと
見ることができないため、これは事実ではない。非常に不愉快だ
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
JavaScriptで書かれた2chソースを、作者リンクを変えてまでして使っているのでは
「盗んだ」といってもいいと思いますし
そのくせ「事実ではない」「非常に不愉快だ」などとよくもまあ言えたもんだと。
502 :
名無しさん@停滞中 ★
: 10/05/15 19:32:50 ID:???
メモ
Windows Mobile 2ch過去ログ倉庫
http://2ch.wmusers.net/
503 :
koreawatcher
◆Nida.eneRA
: 10/05/15 20:01:55 ID:PgRxx5jJ
>>501
なるほどリバースエンジニアリング(カッケー!)で知ってわけですか。
ちなみにスレッド一覧はまちBBS+αです。見比べれば明白です。
確かにスクリプトは2chの流用ではないですね。
その代わりSchBBSそのものですが…。
目に見える部分は確かに改造されていますが、内部的にはそのままであることが
こちらからはよく分かります。
実はThreadicは思いつきで頻繁に仕様を変えるのに、Xenoユーザーからは
アクセス出来ないという苦情が全く来ないという不思議(でもないですが)な
状況が続いています。サポートを続けるか撤退するか難しいところです。
504 :
名無しさん@停滞中 ★
: 10/05/16 13:45:44 ID:???
>>503
threadicさんの所、subbackも手を加えてあったんですか。
そうなるとsubbackの仕様が変わったらまたお手上げですね。
では、offlaw.cgiを要望して作ってもらえたとの事なので
subject.cgi(名前は何でもいいですが)を設置してもらえたら、
仕様変更されても影響は無くなるかもですね。
あと冷静な人が結構居て面白い。
個人的にはエロデウス ◆Vv9y7Z38.2さんの書き込みとか面白いですけど
最近見ないです。
下のが最近ぽいですが本スレは無くなってますし。
http://webcache.googleusercontent.com/search?q=cache:73ETpZKQ1VgJ:be.threadic.com/thread/bbs-jp/read.php/koreajapanplus/1269086384/l50
あとあれだ
threadic.comの管理人さん、スクリプトのソース流用の件はおいといて
どの辺りまで狙ってやっているのかなと。
判っていてやっているのか天然なのか。
twitterの自己紹介文とか見てみると
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
自己紹介文:
独島でスレディクエンジンを開発しているスレディク開発担当です。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
とあるんですが
プロフィール画像がなぜかHITACHIの洗濯機というのが謎。
http://twitter.com/account/profile_image/miyako2_engine?hreflang=en
もしかしたら本当に狙っているのかな?
昔から2chを見ていて、洗濯機御大とかけているのかなとか
http://mimizun.com/log/2ch/gline/1102086638/473
http://blog.livedoor.jp/implst/archives/25350650.html
http://puerutadelsol.seesaa.net/article/4419306.html
http://web.archive.org/web/20051217062449/http://tech.ciao.jp/blog2/archives/2005/07/post_28.html
505 :
koreawatcher
◆Nida.eneRA
: 10/05/17 00:08:29 ID:6V4DCVtS
>>504
仕様変更されたらもう対応しないかもしれません。
メールはある時を境にこちらに一切返事が戻ってこなくなりましたし…。
offlaw.cgiにしても、他の掲示板は以前から対応していたのに、肝心の日韓交流板には
今回のJaneXenoの更新の前日になってやっと予告なしに導入され、それを受けて
JaneXenoをリリースした次第です。
掲示板の内容自体に関しては、韓国人と交流しようとしたにもかかわらず、
いつまでも過去のことを持ち出す先方に激怒して日本人が出ていったのを
何度か目にしました。今や書き込んでいるのは韓国人ばかりですね。
506 :
名無しさん@停滞中 ★
: 10/05/18 00:29:47 ID:???
>>505
そんな事があったんですか。
では仕方ないです。
確かに日本人は居なくなってるですね。
交流もどんどん減っていってつまらなくなっているような。
http://be.threadic.com/thread/bbs-jp/read.cgi/koreajapan/1272186683/60-61
http://be.threadic.com/thread/bbs-jp/read.cgi/koreajapan/1272186683/74
http://be.threadic.com/thread/bbs-jp/read.cgi/koreajapan/1272186683/77
ところで、独り言に近い要望ですが
苺BBS(
http://www.ichigobbs.org/
)もXenoで読めるようになったら有難いです。
掲示板スクリプトはaround BBS(
http://around.at.infoseek.co.jp/
)ですが
十分に枯れた(?)スクリプトなので 仕様変更もそう無いでしょうし。
この苺BBSのなかにある経済板(
http://www.ichigobbs.org/economy/
)は
2chの経済板(
http://namidame.2ch.net/eco/
)とはこれまた全然雰囲気が違っていて
とても面白いのです。
まあ自分だけの印象かもしれませんが。
[改行]
メモ
EROTRONIKA
http://blog.naver.com/faceless0.do
(via
http://akiakane000.blog37.fc2.com/blog-entry-47.html
)
507 :
名無しさん@停滞中 ★
: 10/05/18 00:57:48 ID:???
メモ
2ちゃんねるブラウザ
http://www.2003acmr.org/
http://www.2003acmr.org/yutori7.2ch.net/news4vip/1273910010/
上ですが
http://yutori7.2ch.net/test/read.cgi/news4vip/1273910010/
がdat落ちしても閲覧出来ていたら
どんなに素晴らしい事でしょうか。
508 :
名無しさん@停滞中 ★
: 10/05/18 00:59:37 ID:???
メモ
2ちゃんねるブラウザ
http://www.manuflexgroup.com/
http://www.manuflexgroup.com/yutori7.2ch.net/news4vip/1273910010/
上ですが
http://yutori7.2ch.net/test/read.cgi/news4vip/1273910010/
がdat落ちしても閲覧出来ていたら
どんなに素晴らしい事でしょうか。
509 :
名無しさん@停滞中 ★
: 10/05/18 01:01:43 ID:???
メモ
2ちゃんねるブラウザ
http://www.ridenorthtsar.com/
http://www.ridenorthtsar.com/yutori7.2ch.net/news4vip/1273910010/
上ですが
http://yutori7.2ch.net/test/read.cgi/news4vip/1273910010/
がdat落ちしても閲覧出来ていたら
どんなに素晴らしい事でしょうか。
510 :
koreawatcher
◆Nida.eneRA
: 10/05/19 00:03:24 ID:tSKhGYyh
>>506
いちごびびえすに行ってみたんですが、全スレッドのスレッド一覧を取得する方法が
分かりませんでした。それとやはりdat直読みは無理なんでしょうか?
そこら辺の仕様が良くわかりませんでした。
511 :
名無しさん@停滞中 ★
: 10/05/19 19:56:24 ID:???
>>510
とりあえず
http://around.at.infoseek.co.jp/
のスクリプトをDLして
板を置いてみました。
http://mirrorhenkan.hp.infoseek.co.jp/around/cgi-bin/mirror/index.html
で、判った事ですが
一つのスレッドでdatは二つに分かれているみたいです。
例えば下のような感じ。
・例1
スレッド
http://www.ichigobbs.org/cgi/15bbs/economy/1553/
dat
http://www.ichigobbs.org/economy/economy_1553a.txt
http://www.ichigobbs.org/economy/economy_1553b.txt
・例2
スレッド
http://www.ichigobbs.net/cgi/15bbs/2ch/0115/
dat
http://www.ichigobbs.org/2ch/2ch_0115a.txt
http://www.ichigobbs.org/2ch/2ch_0115b.txt
上の例2の場合、レス136が透明消去されてますが
datを見ると
http://www.ichigobbs.org/2ch/2ch_0115b.txt
の135行目が空行になっているです
次にスレッド一覧ですが、datキーだけ一覧があるみたい。
で、読み込みの都度生成しているのではないかなと。
板
http://www.ichigobbs.org/economy/
スレッド一覧
http://www.ichigobbs.org/economy/economy_new.txt
板
http://www.ichigobbs.org/2ch/
スレッド一覧
http://www.ichigobbs.org/2ch/2ch_new.txt
あと、ホットゾヌ2の通信状態を以前見てみたですけど
htmlを取得してそれをsubject.txt化したりdat化したりされてるみたいでした。
http://yy14.kakiko.com/test/read.cgi/mirror/1186175383/405
512 :
koreawatcher
◆Nida.eneRA
: 10/05/19 20:55:47 ID:tSKhGYyh
>>511
う〜ん。データのフォーマットの違いくらいならなんとかなりますが、
ここまでファイルの構造が違うと対応は難しいです。
せめて、スレッドとスレッド一覧がそれぞれ1アクセスで取得できれば
よかったんですが…。
わざわざ実験で板を設置までしてもらったのにすみません。
513 :
名無しさん@停滞中 ★
: 10/05/20 19:37:03 ID:???
いえ、こちらこそ長々と申し訳ありませんです。
ところで、
>>511
で設置したスクリプトを少し見てみたら
aska.cgiの72行目に
-------------------------------------------
#かちゅ〜しゃ(2chブラウザ)に対応させる(0=no 1=yes)
#
http://members.jcom.home.ne.jp/katjusha/
#注意!ログを2重にとるので2倍重くなります
$katjusha = 0;
-------------------------------------------
というのがあり、「$katjusha = 1;」として投稿してみたら
subject.txt/****.datとも生成されたです。
subject
http://mirrorhenkan.hp.infoseek.co.jp/around/cgi-bin/mirror/subject.txt
dat
http://mirrorhenkan.hp.infoseek.co.jp/around/cgi-bin/mirror/dat/mirror0002.dat
残念ながらdatは投稿した部分しか記録されないようですが
subject.txtはうまくいってるみたい。(レス数のカッコが「<2>」とかになってますが)
という事で、いちごびびえすがaska_list.cgiの元としてaska.cgiを使っておられるなら
管理人さんにその部分を追加して頂けたらsubject.txtとdatの生成は可能かもです。
ふくやんさん、ブログもtwitterもやっておられますが
そういう場で要望するのと、メールでお願いするのと
さあどちらがいいのかな。
といか、メール生きているのかな
http://twitter.com/fukuyan
http://www.1-5-6.net/blog/
http://www.ichigobbs.org/15file/ichigobbs/about.html
こんなところで(どんなところだ)。
あとメモ
いちごびびえすは2ちゃんねるじゃありません -いちごろく-
http://www.1-5-6.net/archives/2005/08/post-322.html
経済/経済学@いちごびびえすの総目次
http://www.math.tohoku.ac.jp/~kuroki/Readings/ichigo.html
いちごBBSまとめログ
http://ichigobbs.ath.cx/
514 :
名無しさん@停滞中 ★
: 10/05/21 18:58:17 ID:???
メモ
2ちゃんねる過去ログ保管庫(
http://b-mark.org/2chlog.html
)
2ちゃんねる過去ログ保管庫2(
http://b-mark.org/2chlog2.html
)
のdat化について
URL例
http://b-mark.org/view?key=society6_gline_1165245437.dat
http://b-mark.org/view?key=ex3_accuse_1080745274.dat&day=20040401
正規表現
m#<dt><a.+?>([0-9]+)</a>.+?:<font color=green><b>(.+?)</b></font>\[(.*?)\] ?(.+?)<br><dd>(.+?)<br><br>#mik
変換結果式
メール欄逆転
URL例の1番目と2番目では保管先が違うのかも。
例えば2番目の場合
http://b-mark.org/view?key=ex3_accuse_1080745274.dat
だとエラーになるです
逆もまた同じ
これまた新しい形ですなあ。
515 :
名無しさん@停滞中 ★
: 10/05/22 19:13:33 ID:???
>>514
追加。「その84」「その84a」という事で
100到達まであと少しですね(←流石に無理だと思いますよ)
ところで、自分とこのプロバイダがまだ規制っぽいのでココで。
Xenoでログ検索するとハングルが出ないです
「・・」ばかりで読めないです
http://image.threadic.com/images/iWDEQN4R58z
あと、デジカメの機種が文字化けしてるです
下の画像のデジカメ画像の「メーカー: チヨ(メニナテ)」って文字化けですよね。
http://image.threadic.com/images/iKgzHMVJofz
どちらも読めるようにして頂けたら嬉しいです
関係ないですけど
http://adult.threadic.com/thread/bbs/read.cgi/pervertplus/1274010479/
どこまで本気なのかなと。
翻訳で見るなら下
http://translate.google.com/translate?js=y&prev=_t&hl=en&ie=UTF-8&layout=1&eotf=1&u=http://adult.threadic.com/thread/bbs/read.cgi/pervertplus/1274010479/&sl=auto&tl=ja
メモ
command.datに下記追加
%GoogleTranslate=
http://translate.google.com/translate?js=y&prev=_t&hl=en&ie=UTF-8&layout=1&eotf=1&u=$URL&sl=auto&tl=ja
516 :
名無しさん@停滞中 ★
: 10/05/22 20:02:50 ID:???
メモ
http://mimi.s151.xrea.com/2chp.cgi/yutori7.2ch.net/news4vip/
http://mimi.s151.xrea.com/2chp.cgi/yutori7.2ch.net/test/read.cgi/news4vip/1274357231/
↑これ
dat落ち後も読めたらいいなー
もふもふ
http://mofumofu.tank.jp/
517 :
koreawatcher
◆Nida.eneRA
: 10/05/23 01:52:53 ID:i8sbv2j6
>>515
結論から言うとどちらも無理です。
MS Pゴシックは日本語のみ、MS UI Gothicはハングルも
表示できるのですが、データがシフトJISである2chでは
通常文字をMS Pゴシック、文字参照をMS UI Gothicに
分ける仕組みでMS Pゴシックの中でハングルを表示しています。
Threadic(UTF-8板)ではハングルにも文字参照は使われない
ため、この方法は使えません。
文字を一つ一つ調べてそれがシフトJISに含まれているかどうかを
調べることはできますが、Threadicのためだけに負荷が増えること
になります。そこでUTF-8板ではすべてをMS UI Gothicで表示
するという手抜き処理を行っています。
ログ検索は複数の板から検索できるので、使用するスキンを
ひとつに統一しなければなりません。
MS UI Gothicを使えばハングルを表示できますが、2chの
表示が不自然になります。そこで大多数が利用する2chを
優先してMS Pゴシックを採用したため、結果としてハングルが
表示できなくなっています。
518 :
koreawatcher
◆Nida.eneRA
: 10/05/23 01:53:51 ID:i8sbv2j6
>>515
チヨ(メニナテ)はハングルの文字化けで、コードはEUC-KRです。
Exifの文字列データは非Unicodeですが、エンコード情報があり
ません。仮にエンコードの自動判定を行うとEUC-JPとして
判断されて「爽(寅澱)」と表示されるだけです。
519 :
名無しさん@停滞中 ★
: 10/05/23 18:40:37 ID:???
>>517-518
おお、ありがとうございます。
スキンでフォントをMS UI Gothicに指定したら検索結果が表示できました。
検索結果だけMS UI Gothicにするような事は出来ないものでしょうか。
AAがずれる等のクレームが考えられますが
AA自体を検索するような事自体 レアケースだと思うのですが。
デジカメ情報の件、判りました。
韓国のデジカメだとSamusung/LG cyon/チヨ(ニメナテ)の3つがあるみたいですが
Sony/Pentax/Fujifilm/Nicon/Canon等の日本製のほうが割合として多いなと。
ただ
http://adult.threadic.com/thread/bbs/read.cgi/pervertplus/1274105714/650
で出ている
「PANTECH]
ってなんだろなと。
ペンタックスと紛らわしいではないですか
http://plusd.itmedia.co.jp/mobile/articles/0508/29/news041.html
http://bizmakoto.jp/bizmobile/articles/0702/06/news100.html
520 :
名無しさん@停滞中 ★
: 10/05/24 20:12:42 ID:???
今まで真魚でハングル表示出来ないのがどうにも不思議だったんですが
>>517
の書き込みを拝見して 表示フォントをMS UI Gothicに変えてみたらうまくいったです
おめでとうございますありがとうございます。
で、TeraPadでも出来るんじゃーないかと見てみたんですが
使用出来るフォントの中にMS UI Gothicが見当たらないもんで
うまくいかないっぽいです。
使っているバージョンは0.93で、作者さんのサイトを見ると最新版っぽい
残念。
521 :
koreawatcher
◆Nida.eneRA
: 10/05/25 00:11:41 ID:+HhL8gA0
>>519
実はMS UI Gothicはひらがなとカタカナのフォントも微妙に違うんです。
MS UI Gothicに変えたりしたら、「他のJaneと見た目が違う」という
不具合報告が殺到します。
板別スキン機能を使って「標準」スキンを
<font face="MS UI Gothic" uface="MS UI Gothic">にして
その他を
<font face="MS Pゴシック" uface="MS UI Gothic">にする
という方法でも、面倒ですが対処できると思います。
「チヨ」 は「株」、「ニメ」は「ペン」、「ナテ」は「テク」のハングルの文字化けです。
だから、(チヨ)ニメナテ=(株)ペンテック=PANTECHです。
>>520
TeraPadは内部は完全にShiftJIS処理で、Unicode文字は"?"に
置き換えられて格納されています。フォントをどのように変えても
表示はできません。さらに、TeraPadでUnicode文字を含む
ファイルを上書き保存するとデータが破壊されるので注意してください。
522 :
名無しさん@停滞中 ★
: 10/05/25 21:25:58 ID:???
余裕がないです
>>521
ありがとうございます。
余裕が出来たら板別スキン機能とはどういうものか見てみるです
てかペンテックと読むですか
どっひゃー
あと、何故か現在消えてるですが
こんなスレッドが立ってたです
どうなるんですかね
読めなくなっても不思議はないですけど
http://be.threadic.com/thread/bbs-jp/read.cgi/koreajapan/1274728115/
-------------------------------------------------------------
1 名前:Developer★[] 投稿日:2010/05/25(?) 04:09:22.85 ID:???
日韓交流掲示板のシステム点検作業によって 5月 26日 0時から 5時まで交流版を利用することができません.
そして, データが遺失されることもできるので, 重要なデータはバックアップしてください.
-------------------------------------------------------------
あとメッセンジャーを出されたり
http://threadic.com/thread/bbs/read.cgi/babo/1274733772/
内部処理がShiftJISとの事、判りました。
痛い思いしたのはそのせいでしたか
523 :
名無しさん@停滞中 ★
: 10/05/26 19:35:43 ID:???
やりかけメモ
http://2chradio.com/
http://2chradio.com/jidou/
のdat化について
URL例
http://2chradio.com/jidou/?dat=news4vip1274753615
http://mirror.sarashi.com/htmltodat/2chradio/1274753615.html
正規表現
m#<dt.+?>([0-9]+) :()<font color=green><b>(.+?)</b></font>:(.+?)<dd>(.+?)<br><br>#mik
前処理
s#(<title.+?) \- 自動速報vip(</title>)#$1$2#ik
s#(ID:)<a.+?>(.+?)</a>(<dd>)#$1$2$3#igk
今現在
元スレ(
http://yutori7.2ch.net/test/read.cgi/news4vip/1274753615/
)はdat落ちしているのに
何故か読めるので。
いつごろまで閲覧可能なのかな
ただしまだやりかけ。
dat化の漏れはないのですが
何故か空行(でもないけど)がところどころ出てしまうのは何故だろうか。
あと本文中の強調タグ(<font>や<b>等)があちこちにあるのをまだやってないです
それと本文中に「<br></b>」が頻繁にあるですけど「<b>」が見当たらないような。
ってシラミつぶしに見ていないので一方的な決め付けだったらごめんなさいです
524 :
名無しさん@勉強中
: 10/05/27 01:46:45 ID:2AS/hlDS
>>521
板別スキン使わなくても、ちょっと変えたいで
いいんじゃないかね?キムしゃん
525 :
名無しさん@停滞中 ★
: 10/05/29 17:07:22 ID:???
よくわかんないです
メモ
.com-indexドットコムインデックスの2ちゃんねるDATリーダー
http://2chdat.com-index.biz/
dat
http://2chdat.com-index.biz/data/
モナメントみたいなものですかね。
そういえばモナメント繋がらないですね
メダロットを語るスレ過去ログ閲覧システム
http://medarot.jp/2ch/dat/
2ch DAT落ちスレ ミラー変換機 ver.4
http://logsoku.com/thread/yutori7.2ch.net/news4vip/1268668570/
526 :
名無しさん@停滞中 ★
: 10/05/30 18:02:50 ID:???
韓国からアクセスがあった場合、韓国版美人時計を表示するようにして
ついでにぽっぷちゃっとも別のものを表示させるようにしてみたり。
どうなってるか見たい物好きの方は
「スタート」→「設定」→「コントロールパネル」で
「地域と言語のオプション」で韓国語を選択してから閲覧してみたらいいかも。
この振り分け処理ってIE専なんですが
韓国でのIE占有率って95%くらいだと5年くらい前に見たので(って5年前では意味ないじゃん)
まあいいかなと。
無意味だけどまあいいかなと
527 :
名無しさん@停滞中 ★
: 10/05/31 20:42:51 ID:???
IE専からクロスプラットフォーム化(カッケー!)にしたつもり
ついでに台湾からアクセスがあった場合、台湾版美人時計を表示するようにしてみたり。
どうなってるか見たい物好きの方は
「スタート」→「設定」→「コントロールパネル」で
「地域と言語のオプション」で「中国語(台湾)」を選択してから閲覧してみたらいいかも。
この振り分け処理ってクロスプラットフォーム化したつもりなんですが
IEの時は従前のもので、
IE以外のブラウザ、例えばFireFox等では
「window.navigator.language;」ってので使用言語を見て振り分けてるんですが
これが自分とこのではどこに設定があるのかわかんない。
FireFoxでは何やっても「ja」って出てしまうです。
という事は、たぶん韓国や台湾からのFireFox等では
それぞれ「ko」「zh-tw」と出て順当に振り分けられるのではないかなと。
うまくいってるかどうかわかんないんですが
こればかりは現地の人から教えてもらうしかないのかな。
にしても、OSの使用言語の変更ってどこにあるのでしょうか。
それをやって取り返しのつかない事になっても困るんで何なんですが。
ちなみに試してみた判別スクリプトはこちら
IEと非IEで表示が異なるです
http://mirrorhenkan.hp.infoseek.co.jp/ltest.html
528 :
名無しさん@停滞中 ★
: 10/06/02 07:02:20 ID:???
堂ちゃん 過去ログ倉庫 - フォルダ一覧
http://www.uu.dnsdojo.net/~dou-log/logs/index.html
529 :
名無しさん@停滞中 ★
: 10/06/07 19:05:37 ID:???
メモ
クイック2ch
http://quick2ch.ddo.jp/
レスアンカーがあるレスだけ自動抽出表示してるのかな
530 :
名無しさん@停滞中 ★
: 10/06/10 17:21:01 ID:???
メモ
doja 2channel Browser
http://2chbrowser.moe.hm/
ExtVipCacheBrowser
http://2chbrowser.moe.hm/vip_archive/
Ajaxバリバリですな
追いかける気力が今は無さそう。
URLを見るとDDNSでやっておられる所みたい
ところで、下のURLがhtmltodatでは文字化けしてしまうんですが
何か対処法はないものでしょうか。
http://2chbrowser.moe.hm/vip_archive/ajax/el/1275777995?ita=dat&_dc=1023696648967
「文字コード自動判別」チェックボックスをオフにして
「UTF-8 -> SJIS変換」にしても文字化けしたままなのです
531 :
名無しさん@停滞中 ★
: 10/06/10 20:21:58 ID:???
いちおうメモ
2channel archives(
http://2chbrowser.moe.hm/vip_archive/
)のdat化について
URL例
http://2chbrowser.moe.hm/vip_archive/ajax/el/1275777995?ita=dat&_dc=1023696648967
正規表現
m#<DT.+?>([0-9]+) : <FONT color="lightgrey">()<B>(.+?)</B></FONT> : (.+?)<DD.+?>(.+?)</DD></DT><BR>(?:<DT.+?>|</DIV>)#mik
前処理
s#^(.+?)<>#<title>$1</title><>#ik
Ajaxでデータ取得表示しているみたいなので
ブラウザで表示しているhtmlを指定しても何も出てこないです
html表示
http://2chbrowser.moe.hm/vip_archives/index.html?id=1275777995&ita=dat
dat化用データ
http://2chbrowser.moe.hm/vip_archive/ajax/el/1275777995?ita=dat&_dc=1023696648967
532 :
◆/vmukiyuzw
: 10/06/10 23:33:03 ID:wQWXw+0U
>>530
んーと、文字化けする根本原因(文字コードを自動判別できない理由)を調べないといけないのでしょうが
時間があんまり取れないのでとりあえず。
> 「文字コード自動判別」チェックボックスをオフにして
> 「UTF-8 -> SJIS変換」にしても文字化けしたままなのです
この方法でこちらでは変換できちゃったのですが・・・。
533 :
名無しさん@停滞中 ★
: 10/06/11 07:42:46 ID:???
おはようございます
>>532
XP Home / XP Pro / 98無印 の3環境で試してみたですが
自分の環境ではどれでも文字化けしているです
うーむ
534 :
名無しさん@停滞中 ★
: 10/06/11 19:39:16 ID:???
>>531
の正規表現はこうですな
m#<DT.+?>([0-9]+) : <FONT color="lightgrey">()<B>(.+?)</B></FONT> : (.+?)<DD.+?>(.+?)</DD></DT><BR>#mik
535 :
名無しさん@停滞中 ★
: 10/06/12 15:40:37 ID:???
やっと判った
「->SJIS変換(J)」というのはボタンになっていたのですね。
今まで全然気付かなかった。うかつ
http://image.threadic.com/images/f1ecaf0cad0fc765ce3f61c5a8090af26f3fd89a.PNG
500 KB
続きを読む
掲示板に戻る
全部
前100
次100
最新50
名前:
E-mail
(省略可)
:
read.php ver2.4 2005/04/13