*Weka [#w2c2ec82] -Wekaの日本語情報 http://weka-jp.info/ -Weka入門 決定木とデータセットの作り方 http://www24.atpages.jp/antibayesian/weka/ -Wekaのインストールと データ分析導入 http://cis.k.hosei.ac.jp/~rhuang/Miccl/ProjectA/lec04-2015.pdf **インストール [#ka30f2a4] 2020年9月現在、Java SE Development Kit(JDK)の最新版は14.0.2、Wekaの最新の安定版は3.8.4。Javaはランタイム(JRE)だとメモリをあまり使ってくれないらしく、大規模データだと動いてくれない。 -JDK https://www.oracle.com/java/technologies/javase-jdk14-downloads.html -本体 https://waikato.github.io/weka-wiki/downloading_weka/ **データ読み込み [#ic52da90] ARFF形式のファイルを作る必要。%でコメント。ヘッダ部分は以下のように書く。 @relation dataname @attribute column-1 integer ・・・ @attribute column-n integer @data ・・・ 「@relation」の後ろにデータの名前を適当に書く。「@data」以降にデータをカンマ区切りで置く。 「@attribute」は変数名(上の例では「column-1」とか)と変数の属性(上の例では「integer」)を書く。~ -使用できる属性 --numeric:任意の数値。 --real:実数。 --integer:整数。 --nominal:変数の値が文字列のとき、取りうる値を{value1, value2, value3, ...}のように列挙(例:@ATTRIBUTE class {Iris-setosa,Iris-versicolor,Iris-virginica})。「nominal」とは書かなくていい。 --string:任意の文字列。テキストマイニングのとき使う。 --date:日付。「"2001-04-03 12:12:12"」のような時には「@ATTRIBUTE timestamp DATE "yyyy-MM-dd HH:mm:ss" 」のように書く。 -参照 --https://www.cs.waikato.ac.nz/~ml/weka/arff.html -arffファイル作成時の注意 --欠損値は「?」で表記すると読み込める(分析できるかは別)。 --BayesNetを使う場合、属性はnominalのみ? -参照 --http://www.weka-jp.info/archives/weka_intro_200304.pdf --https://rhuang.cis.k.hosei.ac.jp/Miccl/AI-2/weka_j.pdf --https://www.jstage.jst.go.jp/article/itej/65/10/65_1398/_pdf **ベイジアンネットワーク [#ja73a1e9] -https://www.cs.waikato.ac.nz/~remco/weka_bn/ -http://heartland.geocities.jp/ecodata222/ed/edj1-8-1-2.html -http://ipintelligence.blog.so-net.ne.jp/2010-06-12 **トラブル [#ta0d0e9d] -Wekaが起動しない --CUI編 http://arakilab.media.eng.hokudai.ac.jp/~t_ogawa/wiki/index.php?Weka%E3%81%8C%E8%B5%B7%E5%8B%95%E3%81%97%E3%81%AA%E3%81%84%20%28CUI%E7%B7%A8%29 --GUI編 http://arakilab.media.eng.hokudai.ac.jp/~t_ogawa/wiki/index.php?Weka%E3%81%8C%E8%B5%B7%E5%8B%95%E3%81%97%E3%81%AA%E3%81%84%20%28GUI%E7%B7%A8%29