■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 最新50

サイズが 480KB を超えています。500KB を超えると書きこめなくなるよ。

メモ3

1 :名無しさん@勉強中 ★ : 07/08/04 06:09:43 ID:???
またまた思いついた事など


2 :名無しさん@勉強中 ★ : 07/08/04 06:11:13 ID:???
メモ

http://tmp6.2ch.net/test/read.cgi/download/1177253614/945
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
945 名前:[名無し]さん(bin+cue).rar[sage] 投稿日:2007/08/04(土) 03:00:03 ID:tcZVe2WO0
p2todatでURLがない場合、該当Dat落ちスレのURLを書き込みプレビューから
P2todatでDat取得しているのだが、手間かかる。
そこでDat取得したい場合、URL入力ダイアログが出て、そこに該当URLを入力して
そのDat落ちURLをp2datで取得ってできませんかね。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


下記で良いのでは。

p2todatに手動入力=p2todat.exe $INPUT


というか
JaneNidaって書き込みプレビューから外部コマンド起動出来ないみたい
出来れば嬉しくなるです(私が)


3 :名無しさん@勉強中 ★ : 07/08/04 06:29:23 ID:???
質問?ボコボコにしてやんよ!
http://bokoboko.dip.jp/
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
当サイトでは、2chのニュース速報(VIP)板で常時作成され短時間で落ちてい
く全レス&質問スレッドをアーカイブし、読みやすくなるよう再構築を行っています。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

現役のスレッドもすぐさま載るようにされてるみたいなので
スクリプトで即時反映するようにしておられるのかな。

で、使われているスクリプト言語なんですが
拡張子を見てみると「index.py」とか「view.py」なので
pythonをお使いなのかと。
すごいなー。


4 :名無しさん@勉強中 : 07/08/05 20:07:06 ID:nWkmOygq
「スクリプトで即時反映」は大袈裟で
一定時間毎に自動更新されてます
以上 突っ込まれても痛いので。


この方、上の以外にも色々やられてるですね。

カスレッド!1人あわせてカスレッド!(β)
http://kathread.dip.jp/
安価たすぜ!
http://ankar.dip.jp/


で、見てみたら
PythonってRedHat系のLinuxには標準搭載されてるとか。
まあ「ソースは2ch」の典型ですが

Pythonお勉強スレッド
http://wing2.jp/~mirrorhenkan/2ch/python/prog/read-light.php/965815778/1



pythonってどういうものなのか見てみたら
やはり他のものとは違うですね(当たり前ですが)

Japanese Python Link
http://homepage1.nifty.com/kazuf/pythonlinkj.html
Python
http://www1.u-netsurf.ne.jp/~merita/python/python40.html


5 :名無しさん@勉強中 ★ : 07/08/05 21:24:06 ID:???
暇じゃないので物理の勉強する
http://slpy.blog65.fc2.com/blog-entry-872.html

意外や意外
DAT2HTML0.26でdat化出来ちゃった。
(IDのフォントタグはそのままだったけど)


6 :名無しさん@勉強中 ★ : 07/08/06 02:50:27 ID:???
メモ

例えば

http://www.youtube.com/watch?v=LudWVcdce_w

のflvの場所は

http://74.125.14.24/get_video?video_id=LudWVcdce_w

みたいです。

http://cache.googlevideo.com/get_video?video_id=LudWVcdce_w

でやってみたら
ステータス302でそっちのURL指定が出て
DL出来なかったので。

というか
IPの数字も固定かどうかわかんない。
固定だったら、自分が使う用に
フォーム入力でDLリンクが出るようなJavaScriptでもやってみますか。



それにしても、以前はURLだけではflv取得出来なかったのに
今出来るようになってるのは
どういう方針変換なのだろう。

こんな記事とか関係あるのかな。

http://la.ma.la/blog/diary_200702282253.htm
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
YouTubeの動画を全画面表示したり字幕くっつけたりするのを作るには、
動画の元ファイル(flv)のURLを知る必要がある。これはAPI使ってるだけ
だと出来ないので、スクレイピングというやつをする。具体的には動画の
貼られているURLにアクセスして、一定期間有効らしいトークン文字列を
抜き出して、get_videoにvideo_idとトークン文字列をわたすとflvのURLに
リダイレクトされる、ということらしい。

少なくともニコニコ動画は通常のAPI利用じゃない、はずだ。公開されてる
APIを使ってて蹴られたっていうならケチくさいな、と文句言えばいいけど、
スクレイピングしてやってるんだから、いつアクセス拒否されてもおかしく
ないし、それはYouTube側の当然の権利だろう。flvの直接利用ってのも
デリケートな問題だ。ビデオファイルを直接保存されてしまうと、アップロ
ードした権利者のコントロールが及ばなくなる。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

「スクレイピングされて負荷が増えるくらいなら いっそDLできるようにしてしまえ」とか。
2chでも 以前はdatの直DL出来なかったのが今は出来るのもそんな理由かもなと。

で、ニコニコ動画のほうは
flvの直DLはまだ難しいのかな。
何かリファラが違うとDL出来なくなってしまったとか見たような記憶があるですが。


7 :名無しさん@勉強中 ★ : 07/08/06 19:40:08 ID:???
書式メモ

美人ニュース+(femnewsplus)
http://wannabe.fam.cx/service/2ch_11/read.cgi?femnewsplus/1186116907/l50
ラウンジクラシック(entrance2)
http://wannabe.fam.cx/service/2ch_14/read.cgi?entrance2/1181567761/l50
野生生物(wild)
http://wannabe.fam.cx/service/2ch_12/read.cgi?wild/1183163198/l50
生活サロン(lifesaloon)
http://wannabe.fam.cx/service/2ch_16/read.cgi?lifesaloon/1147088804/l50
セピア(sepia)
http://wannabe.fam.cx/service/2ch_13/read.cgi?sepia/1186393379/l50
ペット大好き(pet)
http://wannabe.fam.cx/service/2ch_17/read.cgi?pet/1183261138/l50
クラシック(classical)
http://wannabe.fam.cx/service/2ch_15/read.cgi?classical/1185398813/l50


いやすごいっす。
あんまり無理せんといて下さい>DinoSwiftさん


8 :名無しさん@勉強中 ★ : 07/08/06 19:46:01 ID:???
DinoSwiftさんの所を見て思い出したのですが

ラウンジクラシック板は2ch本体にはログを残さない場所との事だったので
スクリプトでローカル保存したものがあったっけです

過去ログ倉庫
http://www2.atpages.jp/entrance2/

どこからだか覚えてないですけど
途中からdatをDLするようにしたもんで
404の場合は拡張子をdatにすると存在しているかも。

同じように
メニューのみ保管したものもやってあったです

にくちゃんねる過去ログ墓場
http://www2.atpages.jp/list/


上二つどちらも1ギガ近い容量を使っておるもんで
ビクビクドキドキで 表に出してなかったです
さあ出してみてどうなるか。

それと、設置してからphpが使える事を知ったので
何だか勿体ない使い方をしてしまったかなと。


9 :名無しさん@勉強中 ★ : 07/08/06 19:52:10 ID:???
あと このサイトですが
datファイルに広告をつけてしまうところなんですが
さてどうしましょ。

tripod.comもそうだったんですが>datに広告タグが付く
専用ブラウザのほうで対処出来ないかな。


10 :名無しさん@勉強中 ★ : 07/08/08 02:02:22 ID:???
<見えない文章>
 makimo.toさん復活ありがとうございます
 makimo.toさん復活おめでとうございます
</見えない文章>


11 :名無しさん@勉強中 ★ : 07/08/08 02:28:54 ID:???
メモ

http:;//61.125.195.90
http://segabito.biford.com/



http://etc6.2ch.net/test/read.cgi/qa/1141102799/317とか見ると
間歇的に復活なさっているのでしょうか。


12 :名無しさん@勉強中 ★ : 07/08/08 15:06:47 ID:???
VBScript で画像ファイルの画像の大きさを取得する (unibon)
http://www.geocities.co.jp/SiliconValley/4334/unibon/asp/getimagesize.html
VBScript Tips (Tips0057)[画像ファイルのサイズを取得する]
http://www.whitire.com/vbs/tips0057.html


13 :名無しさん@勉強中 ★ : 07/08/10 19:29:38 ID:???
http://pc11.2ch.net/test/read.cgi/hp/1184908688/526

久しぶりに見てみたら、自分が書いた筈のスクリプトなのに
んもう わかんないの何の。

あの頃 私は偉かった。


14 :名無しさん@勉強中 ★ : 07/08/11 19:26:27 ID:???
http://jane.s28.xrea.com/test/read.cgi/bbs/1180559017/324
−−−−−−−−−−−−−−−−−−−−−−−−−−−−
(前略)

-参考-
2ch DAT落ちスレ ミラー変換機 ver.5
yellow.ribbon.to/~mirror/
yellow.ribbon.to/~mirror/url.php.txt
−−−−−−−−−−−−−−−−−−−−−−−−−−−−

php版を参考にされても
リンダいや私困っちゃうですよ
んもう色々直すのも厄介だもんで


15 :名無しさん@勉強中 ★ : 07/08/12 22:50:39 ID:???
http://www.23ch.net/
を追加させて頂いたです
ドメインを見ると2007/06/02に登録されたそうで。

ここ スレッドに書かれていたので判ったのですが
何故かgoogleでもyahooでもmsnでもmooterでもbaiduでもヒットしなかったので
もしかしたら23ch管理人さん御自らの書き込みなのかなと思ったりして。
あと雰囲気がdumper.jpさんと似ている感じがしたのですが
ドメインの登録先が全く違ってたです
いやーみんなすごい

で、ここ 恥ずかしながらdatの位置がどうも判らない。
これとアタリをつけた所で呼び出しても404で。
まあhtmltodatの「read.cgi?7.00」でdat化出来るのでいいかなと。

あと、どういうタイミングで保管されているのかもようわからんです
例えばhttp://etc6.2ch.net/test/read.cgi/qa/1141102799/とかは
まだ保管されてないようですし。


あと携帯用中間サーバを二つ追加して
ミラー保管用ボタンのエラーを無くしたです


16 :名無しさん@勉強中 ★ : 07/08/13 00:04:08 ID:???
書き間違い
http://23ch.info/
でした(^^;)

メモ
222.225.251.7


17 :名無しさん@勉強中 ★ : 07/08/13 00:07:34 ID:???
また間違えた

http://www.23.info/

ああダブルエラー


18 :名無しさん@勉強中 ★ : 07/08/13 00:59:40 ID:???
ああトリプルエラー

http://www.23ch.info/


19 :名無しさん@勉強中 ★ : 07/08/15 16:14:35 ID:???
http://ex20.2ch.net/test/read.cgi/gline/1175735168/661-663n

なぜ5年前のスレッドが其処に残しておられたのかはともかく
(共同幻想を抱いてもいいかなとは思うですが)
これをdat化出来ないという理由は
レス1からラストまでを一覧表示出来ないからなので。

http://2ch-i.net/&/live.2ch.net/endless/1035922530/

のままだと全部表示出来ないので

http://2ch-i.net/&/live.2ch.net/endless/1035922530/1-640

とやっても、1から10までしか表示出来ないです。
携帯用なのでそういう縛りを管理人さんが付けられても仕方ない。



もし10レスだけでいいのなら
例えば
http://2ch-i.net/&/live.2ch.net/endless/1035922530/1-10.i
だと

正規表現
m#<p>\[([0-9]+):(.+?)(?:≪(.+?)≫)? \((.+?)\) <a href=".+?">AA</a>\]<br> +?(.+?)</p>.*?<hr>(<p>|<a)#mik

前処理
s#(<title.*?): 2ch-imode(</title>)#$1$2#k

変換結果式
メール欄逆転

でdat化出来るのかなと思うです。


20 :名無しさん@勉強中 ★ : 07/08/15 16:22:58 ID:???
それでも諦めずに
なおかつdat化を試みるとするならば

http://2ch-i.net/&/live.2ch.net/endless/1035922530/1-10.i
http://2ch-i.net/&/live.2ch.net/endless/1035922530/11-20.i
http://2ch-i.net/&/live.2ch.net/endless/1035922530/21-30.i
http://2ch-i.net/&/live.2ch.net/endless/1035922530/31-40.i
http://2ch-i.net/&/live.2ch.net/endless/1035922530/41-50.i
 ・・・
  (中略)
 ・・・
http://2ch-i.net/&/live.2ch.net/endless/1035922530/631-640.i

のそれぞれを各自でdat化して
できあがったものを連結させればできそうです。
まとめてDLして一括置換して一括連結すればそう面倒でもなさそう。


ただここで問題になるのは
スレッドのタイトルがおのおのに付いてしまう事で。
レス1ー10の時以外は必要がないのですが
全部に付いてしまう。

という訳で、心臓バクバクものですが
htmltodatサポート板にまた要望を書かせて頂こうかなと。


21 :名無しさん@勉強中 ★ : 07/08/15 16:44:35 ID:???
追記

http://2ch-i.net/&/live.2ch.net/endless/1035922530/41-50.ni

みたいにしないと
レス1がついてしまうみたい。


22 :名無しさん@勉強中 ★ : 07/08/15 23:23:21 ID:???
http://ex20.2ch.net/test/read.cgi/gline/1165245437/358

ああ恥ずかしい事を書いてしまった
恥ずかしいのう
恥ずかしいのう
ギギギ


私もwshクローラーを出してますが
使うとる人居るのかな。

http://www.geocities.jp/mirrorhenkan/others/datget/
http://www.geocities.jp/mirrorhenkan/others/datsearchget/

これをタスクスケジューラ等で
例えば一時間毎に実行するようにすれば
みみずんさんやDinoSwiftさんのような事が出来ると思うですが。
DinoSwiftさんの出されたCGIのほうが良さそうですけど。


そういえば
perlクローラーとphpクローラーも作ったっけだなー。
出しとけば誰かが活用してくれるかもしれないな とか。


23 :名無しさん@勉強中 ★ : 07/08/15 23:47:42 ID:???
で、メモ

「datsearchget」をgoogle検索したら
下のがヒットしたです

【●】「にくちゃんねる」休止のお知らせ・・・・・・ 過去ログ倉庫【買うか?】
http://2se.dyndns.org/test/readc.cgi/news20.2ch.net_news_1164162822/l50

で、上の中にある単語で検索してみたら
何だか面白そうな事をやっておられるですね。

syoboon
http://www.asks.jp/users/syoboon/
prototypeのお勉強とその他色々
http://2se.dyndns.org/test2/dat_check.htm


24 :名無しさん@勉強中 ★ : 07/08/15 23:51:17 ID:???
さらに検索してみると
同じ方の別のブログ

YNET Weblog
http://blog.yuhisa.com/


25 :名無しさん@勉強中 ★ : 07/08/15 23:58:43 ID:???

ブログから辿ってaboutを見てみると

http://www.yuhisa.com/about.html
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
また、2005年からは、2ch関係を色々とふれてみたり
2006年後半からはASKS?で色々と活動?しております。

2006年4月に2ちゃんねるで使用されていた
Banana(tmp5)サーバーを頂きました。
ありがとうございました。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


うわー
すごいお方なのですね。


26 :名無しさん@勉強中 ★ : 07/08/16 00:58:00 ID:???
>>22の方って
makimo.toさんの掲示板にもお書きになってたんですね。



メモ

http://makimo.to:8000/i/d.cgi/news4vip/2ch.net/wwwww/1187190494/?&p=

これ
http://wwwww.2ch.net/test/read.cgi/news4vip/1187190494/
がdat落ちしても閲覧出来ていたら
どんなにか嬉しい事でしょうか。

ちなみに現在
現役スレの場合は

http:/makimo.to:8000/cgi-bin/dat2html/dat2html.cgi?http://wwwww.2ch.net/test/read.cgi/news4vip/1187190494/

で閲覧可能ですが
本家でdat落ちして、以前の所定位置に保管された場合

http://makimo.to:8000/2ch/wwwww_news4vip/1187/1187190494.html

に移動すると思うのですが
2chフォルダ以下をベーシック認証しておられるみたいです。


もしかしたら>>19-21と同様
携帯用表示からdat化するような方策を考えたら
何とかなるかもです


27 :名無しさん@勉強中 ★ : 07/08/16 09:53:28 ID:???
>>19-21の件ですが
どうにかなったっぽい。

・切れ切れのhtmlをローカルにDL

・htmltodatで一括dat変換

・変換したdatの一覧リストを作成

・Excel等で昇順にソート

・wshで一括連結


これでどうでしょうか。
あとでスクリプトと説明htmlを書いてみますか


28 :名無しさん@勉強中 ★ : 07/08/16 09:55:54 ID:???
それと

http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/467-469n

御返事ありがとうございます

> というわけでオプションで機能追加しないといけない必要性がよくわからないです。

すごく心臓がドキドキして
冷や汗がタラタラ流れてしまったです
あー駄目だ

実害が無ければそれでいいか・・。


29 : ◆/vmukiyuzw : 07/08/16 19:24:15 ID:KY7Or5dG
>>28
自分のレスを読み返してみるとちょっと攻撃的な口調になってますね。
実はPCの調子が悪くリカバリにてこずっていたので
そのせいで少しイライラしていたかもしれません。
お気を悪くされたらすみません。


30 :名無しさん@勉強中 ★ : 07/08/18 03:18:14 ID:???
お待たせ致しました。
お待たせし過ぎたと申しても過言ではございますまい。
(以上 村西とおるさんの声色で)

2ch-imodeのhtmlをdat化する試み
http://www.geocities.jp/mirrorhenkan/2ch-i/

とりあえず自分の環境ではうまくいっているように思えます。
とはいえ注意点というか留意点があるですが
ごめんね疲れちゃった

あと一行目二行目ですが
別に誰も待ってないですよね
ハハハ


>>29
いえそんな。
ところで、これいじっている時に
また二点ほど要望が浮かんだのですが
それはまた後日お願いしますという事で。


31 :名無しさん@勉強中 ★ : 07/08/18 03:32:30 ID:???
で、たまたまですが

http://ex20.2ch.net/test/read.cgi/gline/1175735168/680-681n

で出ていた

http://news19.2ch.net/test/read.cgi/newsplus/1099018630

を、2ch-imodeからdat化してみました。

http://pantomime.jspeed.jp/test/read.cgi/monament5/1099018630/

で、やってみたら
スレッドタイトルがうまくいってないみたい。
うん後日考えようか


32 :名無しさん@勉強中 ★ : 07/08/18 03:42:12 ID:???
あれれ
正規表現が化けてる?
PCが原因なのだろうか

http://www.geocities.jp/mirrorhenkan/2ch-i/2ch-imode_regexp.txt
m#<p>\[([0-9]+):(.+?)(?:≪(.+?)≫)? \((.+?)\) <a href=".+?">AA</a>\]<br> +?(.+?)</p>.*?<hr>(<p>|<a)#mik


33 :名無しさん@勉強中 ★ : 07/08/18 08:31:59 ID:???
メモ

http://makimo.to:8000/i/d.cgi/news4vip/2ch.net/wwwww/1187190494/?&p=

正規表現
m#<hr>([0-9]+):(.+?):(.+?)(?:\[(.+?)\])?<br>(.+?)(<hr>)#mki

前処理
s#(<title>)29-(.*?</title>)#$1$2#k
s#<a href=/i/d.cgi/.+?>([a-z0-9\.\$,\;\:\&=\?\!\*~@\#_\(\)%/'+-]?)</a>#http://$1#igk

変換結果式
$2<>$4<>$3<>$5<>


いろいろ変です
前処理がよくないですし
レス1・3・4・7の名前欄も変


34 :名無しさん@勉強中 ★ : 07/08/18 11:26:38 ID:???
http://ex20.2ch.net/test/read.cgi/gline/1175735168/685-686n

「その31」では無かったっけや
「その32」だもな


35 :名無しさん@勉強中 ★ : 07/08/18 18:51:56 ID:???
>>33の件ですが
単にコロン「:」をデリミタにするだけでは具合が悪いみたい。
日付とIDの所でもコロンを使っているもので。
下記

1:以下、名無しにかわりましてVIPがお送りします。:08/16 00:08.92 ID:r+szmpmV0


どうすればいいのでしょうか。


500 KB
続きを読む

掲示板に戻る 全部 次100 最新50
名前: E-mail (省略可) :

read.php ver2.4 2005/04/13

Gポイントポイ活 Amazon Yahoo 楽天

無料ホームページ 楽天モバイル[UNLIMITが今なら1円] 海外格安航空券 海外旅行保険が無料!