------------------------------------------------------------------------------- ※ GetHTML(W) 注意事項ドキュメント (read1st.txt) ※ ------------------------------------------------------------------------------- ※ 主にバージョンアップについての注意点が書かれています ※ ※ 変更履歴は gethtml(w).ver を参照してください ※ ------------------------------------------------------------------------------- ★★ GetHTML Ver.5.0, GetHTMLW Ver.8.0 より、★★ Proxy Mode 3(Proxy Mode 2 にて、古いデータを保存しておく機能)と、 取得時古いデータを保存しておく機能を実装しました。 詳しくは gethtml.txt および gethtmlw.txt の該当項目をご覧ください。 ------------------------------------------------------------------------------- ★★ GetHTML Ver.4.13, GetHTMLW Ver.7.13 より、★★ (1) 同一サーバ(ホスト)への同時取得数が 1 に固定されました (2) 同一サーバ(ホスト)への連続取得に対し、1秒の wait をデフォルトで入れました 上記は、ブロードバンド化に伴う Web サーバへの負荷を軽減する為の措置です。 同時に、 (a) 同一サーバ(ホスト)への同時取得数設定オプションの廃止 (b) 同一サーバ(ホスト)への連続取得に対する設定オプションの変更 がなされています。詳しくは gethtml.txt および gethtmlw.txt の該当項目を ご覧ください ------------------------------------------------------------------------------- ★★ GetHTML Ver.4.12, GetHTMLW Ver.7.12 より、★★ (1)表示仕様の変更、(2)設定修正のお願いがあります。ご注意ください。 (1)リトライリストファイル(〜.rlf) は、旧バージョンと互換性がありません これは、取得条件設定・許容 URL 設定に関する仕様変更に伴うものです。 ご了承ください。 (2)「取得条件設定」の「文字列/拡張子フィルタ」のデフォルト値に誤りがあり、 .zip や .zoo ファイルを取得してしまいます。 今後取得を行う場合は、必ず「文字列/拡張子フィルタ」を確認・再設定をお願い します。再設定を行えば、以降は OK です。 ※再設定が必要な記述※ "0:.(arc|gz|exe|lzh|z|zip|zoo|hqx|cab)$" が存在していたら、以下に変更。 "0:.(arc|gz|exe|lzh|zip|zoo|hqx|cab)$ .z$" 現在の実装では、上記の |z|zip|zoo の部分の解釈にあいまいさがあり、 zip と zoo がフィルタされません。ご了承の上お使いください。 エディタでの変更が可能な方は、取得データ保存ディレクトリ内にある gethtmlw.cf を開き、上記部分を全て修正してください。 ------------------------------------------------------------------------------- ★★ GetHTMLW Ver.7.11.5 より、★★ 表示仕様が変更されました。ご注意ください。 ・メインウインドウ左の URL Tree(ホスト名と path を階層表示する Tree)は、 プログラムを起動した時点では、家のアイコン一つのみが表示されます。 (従来は取得したホスト名一覧が表示されていました) この家のアイコンをダブルクリックすれば、従来のように URL Tree は表示 されます。 これは、プログラム起動に掛かる時間を短縮するための仕様変更です。 ------------------------------------------------------------------------------- ★★ GetHTML Ver.4.11, GetHTMLW Ver.7.11 より、★★ 仕様がいくつか変更されたことにより、設定を変更しないと期待通りに動作しない可能 性があります。下記に従って設定を修正してください。 ・prohibit.lws の書式が変わりました(正規表現風) →ドキュメントを参照して記述を変更してください。 ・取得条件設定での、拡張子/文字列フィルタの記述書式が変わりました(正規表現風) →ドキュメントを参照して記述を変更してください。 ・LocalWebServer にアクセス制限が掛かるよう仕様変更がありました。 →下記を参照してください ★ネットワークを構築して、他のホストからも LocalWebServer にアクセスする方 アクセス設定をしないと、他のホストからはアクセスできないよう仕様変更されており ます。gethtml(w).txt の「Proxy(LocalWebServer) アクセス制限機能」の項目を読んで access.lws を設定してください。 ★その他の方(自分のマシン内でのみ使用している等) なにもする必要はありません。 ------------------------------------------------------------------------------- ★★ GetHTMLW Ver.7.10.0 より、★★ ・取得条件の設定項目に仕様変更がありました。 ★初めてこれらのプログラムを使用する方 なにもする必要はありません。 ★GetHTMLW Ver 7.10 以前をお使いの方 ・添付のプログラム upto7a0.exe を、データの置いてあるディレクトリ (gethtmlw.cf のあるディレクトリ)に移動します。 ・DOS プロンプトや、エクスプローラ等で upto7a0.exe を起動します。 上記操作を行うと、 ・gethtmlw.cf の、仕様変更に関係する部分の変更を行います。 ・一度行えばその後のバージョンアップでは必要ありません。 ・バックアップとして、gethtmlw.cf.old を作成します。 ------------------------------------------------------------------------------- ★★ GetHTML Ver.4.8.0, GetHTMLW Ver.7.8.0 より、★★ ・取得条件の設定項目に仕様変更がありました。 ★初めてこれらのプログラムを使用する方 なにもする必要はありません。 ★GetHTML Ver 4.8 以前をお使いの方 ・-rg -m- オプションに仕様の変更がありましたのでご注意ください。 詳しくは gethtml.txt をご覧ください。 ★GetHTMLW Ver 7.8 以前をお使いの方 ・添付のプログラム upto780.exe を、データの置いてあるディレクトリ (gethtmlw.cf のあるディレクトリ)に移動します。 ・DOS プロンプトや、エクスプローラ等で upto780.exe を起動します。 上記操作を行うと、 ・gethtmlw.cf の、仕様変更に関係する部分部分の変更、不要部分の削除を行います。 ・一度行えばその後のバージョンアップでは必要ありません。 ・バックアップとして、gethtmlw.cf.org を作成します。 ------------------------------------------------------------------------------- ★★ GetHTMLW ver 7.5.0, GetHTML ver 4.5.0 をお使いの方への注意とお詫び ★★ 上記バージョンでは、 ・取得履歴情報ファイル(gethtml.hif)の書式 ・WebPage データ最終更新時刻の保存方法 が変更しましたが、問題点が多く、回避が難しいため、gethtml.hif の書式を元に戻す ことになりました。よって、以降のバージョンのプログラムを使い場合には、以下の 作業が必要となります。 上記バージョンをお使いの方には、度重なる作業を強いてしまいますこと、お詫びいた します。 ★GetHTMLW Ver.7.5.0, GetHTML Ver.4.5.0 をお使いの方のみ →添付のプログラム upto760.exe を、データの置いてあるディレクトリ (gethtml.hif のあるディレクトリ)に移動します。 →DOS プロンプトや、エクスプローラ等で upto760.exe を起動します。 上記操作を行うと、 ・gethtml.hif のバックアップとして、gethtml.hif.75x が作成されます。 ・WebPage データファイルそのものの更新時刻を、WebPage データ最終更新時刻として gethtml.hif に反映します。 一度行えばその後のバージョンアップでは必要ありません。 ------------------------------------------------------------------------------- ※※重要※※ / セキュリティーホールに関して こちら(http://www.onsystems.co.jp/SecurityHole-HTMLView.html)をご覧く ださい。 特に「Web巡回ソフトにも同じセキュリティーホールの可能性あり」の項です。 簡単に書きますと、ActiveX や Java, Javascript の記述を含むデータを GetHTML(W)でダウンロードし、閲覧すると、最悪コンピュータデータを破壊さ れる 恐れがあるということです。 このセキュリティーホールへの対策ですが、 LocalWebServer を使用して(介して)、http:// で閲覧する ことです。 このセキュリティーホールは、取得され LocalDisk に溜め込まれたデータを WWWブラウザで閲覧する事によって発生します。 そこで、LocalWebServer を介して閲覧すれば、http:// でデータ閲覧が出来 るため、 WWWブラウザは全てのデータを「外からやってきたデータ」とみなし、 「セキュリティーポリシー」が保たれることになりますので、 WWWブラウザの セキュリティー保護が働きます。 もちろん、LocalWebServer を介しても file:// で閲覧しては意味がありませ んので ご注意ください。 ------------------------------------------------------------------------------- gethtmlw ver 6.13.0 gethtml ver 3.11.0 より、 ・拡張子/文字列チェックの仕様変更 がありました。 ★初めてこれらのプログラムを使用する方 なにもする必要はありません。 ★gethtml ver 3.11 以前をお使いの方 -e オプションであたえるファイルの記述方法が大きく変わりました。 gethtml.txt の -e オプションの項を参照の上、変更してください。 また、gethtml.ext は付属のものに置き換えてください。 ★gethtmlw ver 6.13 以前をお使いの方 ・添付のプログラム upto6130.exe を、データの置いてあるディレクトリ (gethtml.hif, gethtmlw.cf のあるディレクトリ)に移動します。 ・DOS プロンプトや、エクスプローラ等で upto6130.exe を起動します。 上記操作を行うと、 ・gethtmlw.cf 内の拡張子/文字列チェックの記述を更新します。 ただし、# で始まるコメントは削除されなくなりますのでご了承ください。 ・一度行えばその後のバージョンアップでは必要ありません。 ★gethtml ver 6.9.3 以前をお使いの方 上記 upto6130.exe を行なう前に、下の各バージョンアップ注意点を全て読み、 該当するバージョンアップ作業を行なってから upto6130.exe を実行してくだ さい。 仕様変更が度重なりましたが、機能・性能向上のためご理解ください。 (TestRelease からお使いの方は、再度 upto6130.exe を実行する必要はあり ません) ------------------------------------------------------------------------------- gethtmlw ver 6.9.3 より、 gethtmlw.cf に保存されるオプションの一部に変更がありました。 よって、gethtmlw ver 6.9.3 以降にバージョンアップする場合は、下記の 操作を一度行ってください。一度行えばその後のバージョンアップでは必要 ありません。 また、gethtmlw を初めて使用する場合にも、下記の操作は必要ありません。 ・添付のプログラム upto693.exe を、データの置いてあるディレクトリ (gethtml.hif のあるディレクトリ)に移動します。 ・DOS プロンプトや、エクスプローラ等で upto693.exe を起動します。 上記操作を行うと、 ・ExtentionList と ExtentionCheck というオプション名が ExtensionList と ExtensionCheck というオプション名に変更されます。 これはスペルミスを訂正したものです。仕様変更が度重なり、ご迷惑おかけ します。 ------------------------------------------------------------------------------- gethtmlw ver 6.9.0 gethtml ver 3.6.0 より、 ・ブックマークファイルの変更(gethtmlw のみ) ・拡張子/文字列チェックの仕様変更 がありました。 よって、gethtmlw ver 6.9.0, 以降にバージョンアップする場合は、下記の 操作を一度行ってください。一度行えばその後のバージョンアップでは必要 ありません。 また、gethtmlw を初めて使用する場合にも、下記の操作は必要ありません。 gethtml に関しては以下の操作は不要です。gethtml を利用の際には、 「-e」オプションの「拡張子/文字列チェック」の記述に関し、 従来コメント記述子が * であったのが、# に変更された点に注意してお使い 下さい。 ・添付のプログラム upto690.exe を、データの置いてあるディレクトリ (gethtml.hif のあるディレクトリ)に移動します。 ・DOS プロンプトや、エクスプローラ等で upto690.exe を起動します。 上記操作を行うと、 ・「ページ名.bmf」というブックマークページを「gethtmlw.bm」一ファイル に統合します。今後はブックマークを「gethtmlw.bm」にて管理します。 ・gethtmlw.cf 内の拡張子チェックのコメント「*」を「#」に置き換えます。 仕様変更が度重なりましたが、機能・性能向上のためご理解ください。 ------------------------------------------------------------------------------- gethtmlw ver 6.8.0 gethtml 3.6.0 より、データ保存の仕様が変更されました。 よって、gethtmlw ver 6.8.0, gethtml ver 3.6.0 以降にバージョンアップす る場合は、下記の操作を一度行ってください。一度行えばその後のバージョン アップでは必要ありません。 また、gethtmlw, gethtml を初めて使用する場合にも、下記の操作は必要あり ません。 ・添付のプログラム upto680.exe を、データの置いてあるディレクトリ (gethtml.hif のあるディレクトリ)に移動します。 ・DOS プロンプトや、エクスプローラ等で upto680.exe を起動します。 上記操作を行うと、 ・例えば http://www.aaa.bb.cc:8080/.... の URL の WebPage データは 今まで www.aaa.bb.cc/8080/.... 以下に保存しましたが、これを www.aaa.bb.cc_8080/.... 以下に移動します ・例えば http://www.aaa.bb.cc:80/.... の URL の WebPage データは 今まで www.aaa.bb.cc/80/.... 以下に保存しましたが、これを www.aaa.bb.cc/.... 以下に移動します ・元の gethtml.hif をバックアップとして gethtml.hif.org を作成します。 よって、すでに gethtml.hif.org が存在している場合は upto680.exe は 実行できません。 これは、Netscape Navigator は http://www.aaa.bb.cc:80/ を http://www.aaa.bb.cc:80/ として扱うのに対し、 Microsoft Internet Explorer は http://www.aaa.bb.cc:80/ を http://www.aaa.bb.cc/ とあつかうため、旧来のバージョンで http://www.aaa.bb.cc:80/ として取得 したデータを Internet Explorer で閲覧できない不具合に対処したものです。 ------------------------------------------------------------------------------- gethtmlw ver 6.5.0 より、環境設定値の保存仕様が変わりました。 よって、gethtmlw ver 6.5.0 以降にバージョンアップする場合は、下記の操 作を一度行ってください。一度行えばその後のバージョンアップでは必要あり ません。 また、gethtmlw を初めて使用する場合にも、下記の操作は必要ありません。 ・プログラム upto650.exe を、データの置いてあるディレクトリ (gethtml.hif のあるディレクトリ)に移動します。 ・DOS プロンプトや、エクスプローラ等で upto650.exe を起動します。 このとき、操作を行なうかどうかを聞いてきますので、y を入力してリター ンキーを押すとデータの更新が行なわれます。 上記操作を行うと、 ・Windows ディレクトリにある gethtmlw.ini から、取得条件に関する設定値 を抜きだし、データディレクトリに gethtmlw.cf として記録します ・元の gethtmlw.ini のバックアップを gethtmlw.ini.bak として保存します このプログラムは、 http://www.vector.co.jp/authors/VA014425/binary/upto650.lzh に置いてあります。 --------------------------------------------------------------------- gethtmlw ver 6.3.0 gethtml ver 3.3.0 より、取得の条件設定に仕様変更がなされました。 上記以降のバージョンで初めて取得を行なうときは、かならず条件設定を 確認してからお使いください。 変更された点 更新データのみ取得、新規データのみ取得、の2つのオプションの廃止。 取得済みデータの取得条件、オプションの新設。 gethtmlw.exe のみの情報 gethtmlw.ini で要らなくなった記述(削除して構いません) GetModifiedOnly=x NewOnly=x ------------------------------------------------------------------------------- gethtmlw ver 5.4.0 gethtml ver 2.12.0 より前のバージョンをお使いの方へ。 WWWServer が「移動ページ」と返答した Web ページを LocalWebServer 部で再現しきれなかったため、「移動ページ」の扱いを変更しました。 これにより、旧バージョンで蓄積したデータの閲覧時に、「移動ページ」 から移動先へ自動的に移動する機能に支障がでる(手動でジャンプする必 要がある)ことがあります。これを解消したい場合は、gethtml.hif を 新バージョンに対応するプログラムを添付しましたので、ご利用ください。 (コンバートしなくても、あまり不具合に見舞われることはありません。 あくまでも、念のためのコンバータです) コンバートプログラム名: upto2120.exe 実行方法: このプログラムを gethtml.hif のあるディレクトリに入れ、DOS プロ ンプトまたは、エクスプローラ等で実行してください。 プログラムは、gethtml.hif のバックアップとして、gethtml.hif.cnv ファイルを作成します。万が一コンバートした後に gethtmlw.exe 等がおかしな動きをしたり、コンバータが異常終了した場合は、 gethtml.hif を削除し、gethtml.hif.cnv を gethtml.hif にリネームし てください。 このプログラムは、 http://www.vector.co.jp/authors/VA014425/binary/upto2120.lzh に置いてあります。 -------------------------------------------------------------------------------