2022-02-13

雑草と食べものから学ぶこと

だいぶ更新が空いてしまいました。

少し近況を書きます．

2021年春に福井県に戻りました。

今は酒米の品質向上という思いがけない課題をいただき，心機一転で励んでおります．

米粒の形状や構造が，登熟過程にどう影響されるか．非常に面白いテーマです．

またお酒というテーマ自体，その地域の気候・風土と技術・文化が問われる、総合科学だと捉えています．

信州ではリモートセンシングで雑草の空間動態を見てきたわけですが、

雑草を見る上で大切なのが、バラつきをどう扱うか？です。

何故ならバラつきこそ、雑草の強かさの一部と言えるからです。

もしも種子が均一で、同じ温度・湿度に置かれることで一斉に発芽したらどうなるか？

種内競争は激しいわ、日照りや寒の戻りが来たら全滅するわで、非常にリスキーです。

一方、イネの育苗だったら話は変わってきます。

同じ日に蒔いて同じように加温した種籾の生育がバラバラだったら、田植えがやりにくくってしょうがない。

作物は人間による選抜の過程で、野生ではあり得ないような均一な集団となりました。

しかし、それでも生きもの。個体ごとに差はあるし、個体の中でも早く咲く花と遅く咲く花があって、登熟にもタイムラグが生じます。

あんまりバラつくと、今度は加工や調理の時に厄介です。火加減、水加減、塩加減をどこに合わせたら良いかは職人にとっても悩ましい問題です。

しかし一方で、バラつくことによってそれらを混ぜた時にちょうど良い配合になるということもあるでしょう。

バラつきが美味しさにどう影響するか、非常に面白いテーマです。

バラつきを丁寧に扱うなら、ちゃんとデータの分布を見なきゃいけません。

分布を見ることで、その背後の構造とその変化を想像することができます。

そういう意味では、パラメータにも確率分布を持たせるベイズモデリングの考え方は、雑草にも食品加工にも適していると思うのです。

栽培植物は、生物としては均一ですが、原料としては逆に不均一という、微妙なところにいます。

だからこそ、生育、収穫、貯蔵、流通、加工、調理、実食といった田畑から胃袋に至る過程の中で、その確率分布を追っていく必要がある。

顕微鏡を覗いたり画像解析をしたりしながら確率分布を想像し、それをモデルで繋いでいく時間は、自分の仕事を一番美味しくいただけている気がしています。

2020-11-14

「何も無い」とか，アホぬかせ．

九月を以て伊那谷での三年にわたる修行を終えまして，

今年度いっぱい半年間だけ，九州宮崎に来ております．

で，どこの地域に行っても地元の人が言うのは

「ここは何にも無い」ってなこと．

宮崎なんて，有名な人誰も出てないし・・・何言ってんの．

財部彪と若山牧水と温水洋一を輩出しておいて，その言い草は無いだろう．

大体，こんなに長く砂浜が続く風景自体，珍しいんだからな．

越前生まれの私にとっては，海といえば二時間サスペンス的な断崖絶壁なんだから．

でも，そういう地形が生み出す生態系や風景もまた，私は好きだけどね．

ズバリ言っても良い？(福山雅治風に)

地域に魅力が無いんじゃない．

そう言う人に愛とセンスと教養が無いだけだ．

土地には地球の変動の歴史が表出しているわけで．

そこにある程度の期間人が住み続ければ，文化も根付くわけで．

それを無と断ずるのは，墓石を平然と踏みつけるようなもの．

謙虚さとは対極にある，極めて傲慢でバチ当たりな考え方だと思う．

芸能人でも，一個一個のパーツはそれほど良くなくても，全体としてカッコいい人やキレイな人はいて，そういう人は代えが効かない．

しかも，そういう人は三十過ぎてから人気が出ることが多い．

日本の各地域はそれぞれ長い歴史があるんだから，目立つものやわかりやすいものを切り取るような安いアピールは止めた方がいいと思う．

魚沼産コシヒカリに，沖縄産アグー豚に，枕崎産鰹節に，田子産ニンニクを使用しております・・・って，

食材としてはどれも立派なものだし，それで何を作ってもとりあえず味は良いだろうけど，そこに何の物語があるのか．

地域おこしとは，フランケンシュタインのパーツを東京に供給することじゃない．

そこにあるものの物語を紡ぎ，体験を共有することだ，と私は思う．

「なぜこれがこの地域で食べられているのか？」「何がこれを美味しくしているのか？」を分析的に追求する．

同時に，実際にその地域に行って得られる体験，ライブでしか味わえない感覚を伝える．

で，私はどちらかというと，前者の方が得意な気がする．とはいえ，後者もやらんといかんだろう．

喋りやイベントは，あまり欲張らずに目的を明確にすれば，それほど怖がるようなものでもないらしい，ということを最近知った．

地道に調べて，表現していこう．

2020-08-03

匠の技とは何ぞや

かつて堀江貴文氏が「料理人になるのに何年も修行する奴はバカ」と発言し，物議を醸した．
随分な言い草だとも思ったが，彼の言いたいことも分かる．
「匠の技」というのは，とかく聖域として扱われやすい．
しかし，実際どうなのだろう？
職人の持つ技能は，他のより効率的な学習によって部分的にでも置き換えられないのか？

確かに，職人の作るものや仕事ぶりには，毎度惚れ惚れとさせられる．
料理人は客を観察して性別や体格，利き手を把握し，味付けや盛り付け，配膳の仕方まで気を配る．
紙漉き職人はその日の気温や湿度によって，ネリの配合を微妙に調節する．
これは知識だけでは不可能で，相応の場数を踏まなきゃできない．

スマート農業に対する否定的・懐疑的な見方の多くに，匠の技を神聖視する姿勢が見え隠れする．
すなわち「長年の経験に裏打ちされた仕事が，機械なんかにできてたまるか」というような論調だ．
特にAIの発達は人間にSFじみた不気味な印象を与えるようで，
チェスや囲碁のソフトが人間のチャンピオンを負かしたというニュースを，手放しで喜ぶ気にはなれないという人が多いだろう．
それと同じ不気味さを，スマートなんちゃらという言葉から感じ取る人がいても無理はない．

しかし，全ての農家がスマート農業を導入しなくてはいけない理由は，どこにもない．
ここは機械で代替してもいいな，と思うところに導入すればいいのだ．
問題は，「いいとこどり」しにくい現状にある．
大手メーカーが作るシステムは多くの機能が標準搭載されていて，欲しい機能だけを導入することが難しい．
そのぶん導入コストが高くつくことになり，これが中小農家に広まらない一因だろう．
必要十分な機能をビュッフェ形式で組み合わせられるようにすれば，新たな市場が開けると思う．
自分たちが使う技術なのに，その開発でカヤの外に置かれれば，誰だって面白くない．
カスタマイズを容易にすることで，農家の職人魂を刺激することができれば理想的だ．
同時に農業技術を研究する者は，どういう形態の農家を対象にしているかを常に意識しなくてはならない．

実際，職人といえど機械化の恩恵を部分的に受けているものだ．
料理人も麺を茹でる時間はタイマーできっちり計る人が多い．
だからと言って，客の入りに応じて自動で麺を茹で，盛り付けや配膳までする機械を欲しがるだろうか？
そういう業態の店があってもいいが，それをすることで失われる価値もまたあるはずだ．
だが実際，回転寿司はそれに近いことをやって一定の成功を収めている．
職人は客と顔を合わせることもなく，工場のようなベルトコンベアーを使い，プラスチックの皿で寿司を食わせる．
タッチパネル横のスピーカーが皿が来ることを必要以上の音量で喚き立てるので，まるでゲーセンのような騒々しさだ．

また，料理人のほぼ全員が洗濯物は洗濯機に放り込んで脱水まで全自動，という具合だろう．
「洗濯も手洗いに限る，機械なんぞに任せられん！」などと言うのはよほどの変人である．まあ，好きにしてくれて構わないが・・・
例えば農地周りの草刈りや獣害対策などは，多くの農家にとってできれば手をかけたくない分野に違いない．
そういう分野には，スマート技術を導入する意義は大いにある．

私自身，たまに陶芸をやる．
多少の金を出せば，私が作る茶碗や花瓶よりよほど良いものが買えるだろう．
下手くそな素人が作るのは，時間的にもコスト的にも効率が悪すぎる．スマートさの欠片も無い．
ただ，陶芸をやることで私が求めているのは，単に茶碗や花瓶という「モノ」ではない．
作る「過程」や使う「体験」を欲しているのである．
農業にも，いやどんな仕事にも，そういう側面はあるだろう．

スマート技術を追求することは，「経験することの意味」を問うことなのかもしれない．

2020-07-23

ものがたりたがりばかり

まなじ使えるデータや情報が増えると，なんでもかんでも，とかく結びつけたくなるもの．
壮麗な宮殿のような立派なモデルができると，仕事した感満載ですもんねー．
せっかく集めたデータを使わないともったいない気もするし．

どうしても人は物事を因果関係で結びつけた物語を創作する癖があるようで，
かくいう私もそう．「最近の学生は」とかつい思っちゃう．
年をとると尚更面倒くさがって，わかりやすいストーリーを作りたがるのかも．

数式やプログラムが書けたりするとそれをモデルに組み込みたくもなるんですけど，
そこは冷静に，AICでもRDでもベイズファクターでも使って，
重要じゃない変数をオッカムの剃刀でバッサバッサ切り捨てていくべきでしょう．

統計学者のオーリー・アッシェンフェルターらが作ったボルドーワインの価格のモデルは，こんな感じ．
「ワイン価格〜前年10〜3月の降水量 + 8, 9月の降水量 + ワインの年齢」
試飲しなくても気象データから価格の見当がつく，というもの．
この単純なモデルの前に，多くのワイン評論家が敗れ去りました．
「ワインは試飲してみなきゃわからない」って，専門家もみんなも思い込んでたんです．
だって，そんな感じするもん．

もちろん，この単純なモデルを作るためには膨大なデータが必要でした．
最後に残ったモデルが，少ない変数しか必要としなかった，というだけです．
モデルの変数が少なければ，運用時のデータを集める手間は省けます．
こういうモデルで農作業や生態系管理の支援をしたいものです．

モデルに人間と同じような過程を踏ませる必要はありません．
要は「人間と同等かそれ以上の結果が得られればいい」のですから．

「荷物を拾う確率は，他の荷物が周囲に少ないほど高くなる」
「荷物を下ろす確率は，他の荷物が周囲に多いほど高くなる」
という2つのルールのみに従うロボットを数台，荷物がバラバラに置かれた部屋でランダムに動かすと，
やがて部屋の中の数カ所に荷物がまとめられた，という実験があります．
こういう心配になるくらい単純な仕組みが案外，人間をルーティンワークから解放してくれるかもしれません．

で，人間が拵えがちな物語の中で一番安直で危険なのが「頑張ればうまくいく」．
こういうことを言っちゃいけない．特に大人が子供に対して言っちゃいけない．
いちいちご大層な「達成感=努力と成功の因果関係」を求めて，頑張ることが目的化して，
報われなかったり否定されたりすると不貞腐れる，面倒くさい大人になりかねない．

民間企業では，売上前年比○%増を目指すぞ！なんていう目標の立て方をするところが多い．
では統計学の本を開いてみましょう．時系列データの構造はどうなっているでしょうか？
「時系列データ = 短期の自己相関＋周期的変動＋トレンド＋外因性＋ホワイトノイズ」
このうち営業努力でどうにかなるのは，
「トレンド」を伸ばすか，別の市場に移って「外因性」を変えることくらい．
それなのに売上データをロクに分析もせずに目標立てて頑張るぞ！って，誰得なんですか？

頑張るのは当たり前．それでもうまくいかないことがある．
そこで別のことをやるかしつこく続けるか，じゃないですか？

「ゴルゴ13」のデューク東郷は仕事の成功のために必要な要素として，
「10%の才能，20%の努力，30%の臆病さ，40%の運」
を挙げています．
もちろんこれは個人の見解ですが，東郷は経験からこのようなモデルを構築したようです．
凡百の少年漫画とは違って綺麗事はヌキ．これぞ大人ですね．

「うまくいこうがいくまいが，やるべきことをやる」の方が，よっぽど自然だと思います．

参考文献
O. Ashenfelter, D. Ashmore & R. Lalonde (1995) Bordeaux Wine Vintage Quality and the Weather. CHANCE, 8:4, 7-14.
J. L. Deneubourg, S. Goss, N. Franks, A. Sendova- Franks, C. Detrain and L. Chretien (1991) The dynamics of collective sorting robot-like ants and ant-like robots. Proc. of the 1st Int. Conf. on Simulation of Adaptive Behaviour, pp.356-365.
馬場真哉(2018)『時系列解析と状態空間モデルの基礎』プレアデス出版
さいとう・たかを(1988)『ゴルゴ13 (66)』リイド社

2020-07-14

データのバイアスを如何せん

前回，データを収集・共有するのは今やごく当たり前で，
これからはそれをどう解析して実際の行為に結びつけるかが大事だ，という話をしました．
そのためには，データの性質に合わせた解析方法を選ぶ必要があります．

そもそも，僕らはどうやってデータを得ているのでしょうか？

気象データなら，各地に設置したセンサーで気温や湿度や気圧を計測します．
実験データなら，電子天秤や吸光度計などの測定装置の値を読み取ります．
野外調査データなら，観測者がフィールドを歩き回り，ひとつひとつ記録していきます．
これら従来のデータは，装置の性能や観測者の力量によってある程度の精度が担保されています．
だからこそみんな「母集団から抽出したサンプルについて，正確な情報を得た」という前提で解析をするのです．

しかしこれらのデータも，必ずしも寸分違わぬ数値ではありません．多少なりともズレているものです．

こういう誤差はできれば排除したいものですが，限界はあります．

自然界には，観測誤差以外にもばらつきの原因になる要素がたくさんある．

そのばらつきが大事だったりするので，そういう時には観測誤差とその他の要因を分けて考えたい．

例えば雑草の発芽のばらつきは重要な生存戦略なのに，観測誤差と混ざっちゃって結局よくわからなかった，っていうんじゃもったいない．

観測の際にどんなバイアスがかかっているかを想像し，それを数学的に表現できれば，誤差をモデルに組み込むことができます．

データを取ったときの方法や状況が分かれば，どんなバイアスがかかっているか想像できますが，

ビッグデータではそういうわけにはいかないことがあります．

SNS上のリア充アピールや病みツイートも，今や立派なデータになり得ますが，

それがどんな人によって，どういう状況で発信されたかがわからないと，データの質や構造がわからないのです．

「iNaturalist」のデータにしても，AIによる画像判別の精度も上がってきたし，キュレーターという分類の専門家も入ってくれているとはいえ，
そのデータを分布解析に使う際には，その構造に注意した方がいいでしょう．

極端にいうと，素人100人が東京の公園で集めた植物の分布データと，植物学者が単独で北アルプスを縦走して得た高山植物の分布データとでは，
データの質や構造が違います．

生物の分布データは，観測の際の精度に制約が大きい．

そこで，数理生態学者のダリル・マッケンジーは、観測時の発見率を明示的にモデルに組み込むことを提案しています．

しかしこれだって，データの構造がわかっているからこそ．

さらに，その発見率は努力量(調査にかけた人手と時間の積)に依存しますが，専門家1人と素人1人を同じにカウントするわけにもいかんでしょう．

やはり，どういう条件でデータがとられ，誤差が何によって生じているのかを気にする必要があります．

いくらビッグデータと言っても、データの構造が分かりやすいものから利用していくと良いでしょう．

データの質が担保されているとか，観測者の層が限られているデータです．

一方で，ビッグデータを活用する方法も探っていくべきでしょう．

最近，ビッグデータの誤差構造を理解するには，認知科学的なアプローチが参考になるんじゃないか，と思っています．

例えば、この前の学生実習で「iNaturalist」を使って信大農学部構内の植物のマッピングを行いました．

馴染み深いものからマニアックなものまで，10種類の雑草を探してくるよう学生に指示したのですが，

事前に言い添えるコメントしだいで，探す際の行動が違ってきます．

「よーく探してみてね」と言えば，少ししかないものだと思ってひとつ見つけたら満足してしまうし，

「いっぱいあるやんけ」と言えば，もっとあるんじゃないかと思って他にも探そうとする．

結果的に，事前の情報に引っ張られたデータになるわけです．

こういうふうに事前の情報によって判断が引っ張られるのを，心理学では「アンカリング効果」と呼ぶそうです．

思えば，野外調査ではこういう状況はしょっちゅうある気がする・・・

意図的に情報を与えなくても，先入観は各々持っているものだし．

多少面倒でも，データを取る前に目を慣らす時間を設けるとか，工夫したいものです．

参考文献

MacKenzie et al. 2006. Occupancy Estimation and Modeling: Inferring Patterns and Dynamics of Species Occurrence. Academic Press, Burlington.

Kahneman 2011. Thinking Fast and Slow. Farrar, Straus and Giroux, New York.

2020-07-05

研究者の仕事って何？

論文を書いていてふと思ったこと．
データ集めて解析して論文書いて・・・だけじゃ物足りないなあ，と．

論文は、コミュニケーションのための媒体です．
誰とのコミュニケーションか？といえば，主に「研究者」です．
ただし，ここでいう「研究者」とは，仕事で研究をやってる人だけでなく，ライフワークとしてやっている在野の研究者や愛好家も指します．

特に「分類学」「天文学」「考古学」「歴史学」「民俗学」「文学」「哲学」のような分野では，プロだけでなく在野の研究者や愛好家が活躍してきました．
(その中のスター的存在が，エリック・ホッファーや南方熊楠です)
しかし，それは逆に言えば「それ以外の分野には，仕事で研究やってる人でないと手を出しづらかった」ということでもあります．
とりわけ，高価な装置や組織的な調査を必要とするテーマは，プロでないとなかなか手が出せなかった．

時代は変わりました．
情報の「共有」「解析」「発信」を今までよりはるかに速く，安くできるようになってきました．
調査データの共有は進んできていて，データの所在や利用方法を掲載するデータジャーナルというものもあれば，「iNaturalist」のような誰でも参加できるプラットフォームもあります．
オープンデータってやつですね．

でも，データやその集め方を共有するだけで十分なのか？
例えば昆虫少年を増やすことにはなって，それはそれで素晴らしい．
でも，そうやって探すことや調べることそのものに熱を上げられる人はごくわずかで，調べたことから何が言えるか？を示せないと，なかなか続かないのが現実です．
また，悪くすると研究者が市民をデータ集めのコマとして使い，そのデータで論文を「書き逃げ」するだけになりかねない．
そこからさらに踏み込んで，得られたデータを解析して，何が言えるか？までを研究者と市民が一緒にできれば，フィールド研究は次の段階に行けると思うんです．

僕らがやっている生態学は，生きものの生き様に純粋な興味を持ちつつも，その生物や生息環境をどう保全・管理していくか，という実際的な問題にも取り組んでいます．
そうなると，研究者間のコミュニケーションだけでは不十分で，実際の管理を行うことになる一般市民や業者さんたちともコミュニケーションが必要です．
そのコミュニケーションの中で，本当に痒いところが何処にあって，そこを掻くために何ができるかを一緒に探ることができます．
で，今はデータの共有にかかるコストが下がり，表現方法も多様化してきている．
これまでできなかったコミュニケーションができるに違いない．

研究の仕事を分解すると，
・課題設定
・データ収集
・データ解析
・コミュニケーション
という具合になります．
これら一連の過程をデザインすることが，これからのフィールド研究者の大事な仕事なのではないでしょうか．
そうなるといま必要なのは，オープンデータを想定したデータの収集・解析の手法を研究し，普及することです．

先だって，雑草などの生物の分布を解析する用のjagsコードを「GitHub」に公開しました．

github.com
空間分布の二値データがあれば，その出現，死滅，侵入の確率を推定できます．
植物などの固着性の生きものを想定しています．
（説明書きがもう少しないと扱いづらいですよね，スミマセン・・・）
これのおかげでドローンの画像からクズの分布の変化をモデリングできたので，論文を鋭意執筆中です．

ただ，在/不在の二値データって，市民がやるにはちょっとハードル高いんですよね．
一度見れば「いる」ことはわかるが，「いない」ことを確認するには調べ尽くさないといけないから．
だから，日常の中で得られるデータは，大抵「在のみデータ」です．
そのためには．過去の記事でもお話しした「最大エントロピーモデル」を使って，在のみデータから生きものの分布を推定する方法があります．
これを使った論文が最近増えていますので，私もこれで外来雑草の分布推定をやりたいと考えています．

2019-10-22

萌虫すごいぜ！

ある昆虫マニアの学生が，こんな話をしてくれました．

日本甲虫学会の学会誌「さやばね」は，毎号甲虫の細密な図が表紙を飾っているのだが，最近なんだか毛色が違ってきたとのこと．

どんなイラストなのか，以下の学会のサイトで確認してみてください．

http://kochugakkai.sakura.ne.jp/publication/sayabane/sayabane-bibliography.html

第34号以降，甲虫がょぅι゛ょキャラ化しています．

新しい編集委員の趣味らしいのですが，会員の中で賛否が分かれ，中には憤慨している古参の会員もいるそうです．

まあ，ヨソの学会の内輪の話には，興味ないんですけどね・・・

が！　私は確信したッ！

「キャラ化」は日本の伝統芸だッッッ！

私の父は高校で国語を教えていましたが，

その父の学校で使っていた古文の教科書の表紙が「百鬼夜行絵巻」でした．

私はその絵を一目見て「ポケモンや！」と思いました．

日常の様々な道具に目鼻がついて手足が生えて，奇怪だけどどこか可愛げのあるキャラクターに仕上がっている．

谷崎潤一郎の『陰翳礼讃』にもあるように，日本人には新しく清潔なものよりも時間が経って手垢がついたりくたびれたりしたものを好む傾向があります．

ひとつひとつの事物に強い愛着を持ち，時として人格のようなものさえも認める感覚．

「八百万の神」とか「一木一草にも仏性あり」といった，ある種の汎神論的な世界観がその根底にあるのかもしれません．

「キャラ化」は愛のなせる業．その魅力を端的に伝えるための手段と言えるでしょう．

日本人はこれを昔から行ってきました．

古くは『源氏物語』や『平家物語』の登場人物を能や歌舞伎の舞台で演出し「キャラ化」しているわけです．

その「キャラ化」において重要なのが「記号」です．元ネタの特徴を，さりげなく造形の中に盛り込むのです．

例えば，能「清経」の主人公，平清経の衣装を見てみましょう．

(参考URL) http://www.nohgaku.or.jp/performance/h23_osaka.html

清盛の孫にあたる平家の貴公子で横笛の名手として知られましたが，

平家軍が敗北を重ねるなか絶望し，極楽往生を願って豊前国で入水し，二十一歳でその生涯を閉じました．

舞台では，死後に霊として妻の前に現れ，成仏できずに苦しむが，最後は念仏によって救われる，というストーリーが展開されます．

この演目で清経役の役者が着ける袴には，波の模様がデザインされていることがあります．

都から遠い西の海の中から霊となって妻の元に帰ってきた，清経の悲劇的な境遇が端的に表れています．

能の舞台は舞台装置を極限まで排したミニマルな空間なのですが，

面や装束でそのキャラクターの背景や内面を表すことに成功しているのです．

そして今，日本人のキャラ化の矛先は，思わぬ方向へ・・・

「刀剣」「戦艦」「細胞」など，あらゆるモノが擬人化されて大人気．

これらのキャラクター造形にも，元ネタに結びつく記号がふんだんに盛り込まれています．

最近は「仏様」をイケメンキャラ化したゲームまで登場し・・・

今年の春に高遠で「石仏総選挙」をやった身としては，何だか嬉しいですわあ．

ありとあらゆる分野のヲタクたちよ．案ずるな，胸を張れ！

なかなか理解されないニッチな好みでも，伝え方はあるものだ！

ストーリーに，キャラクターに，渾身の愛を込めるのだあああああああッ！！！