結局、ドローンで何ができるの?

この夏から,ドローンの登録が義務化されますね.

お金はかかってしまいますが,これも時代の趨勢です.

私も個人でドローンを持っていますが,オンラインで案外簡単に登録できました.

https://www.mlit.go.jp/koku/drone/

 

また,ドローンを飛ばすときには事故のリスクは常にあるので,ドローンが壊れたり人やモノに被害が出たりした時のために,ドローン保険に入っておくのも忘れずに.

自動車なら自賠責保険の加入は義務で,その上で任意保険に入るのが基本ですから.

使い方を一歩間違えばケガをするという意味ではクルマと一緒です.

 

あと,飛ばすときは近くの人に挨拶するというのも,大事ですね.

好奇の眼で見て不用意に近づいてくる人や,逆にけしからんみたいなことを言う人も結構いるので.

ドローンを誰にとっても身近なものにするためにも,コミュニケーションは大切です.

 

ドローン自体はもう目新しいものではなくなっています.

ただ,スマート農業を推進する上で,これさえあれば何かできるだろうという安易なノリで導入する向きもありますが,そんな単純じゃありません.

やはり,その長所短所を知った上で,道具の一つとして加えるのが正しいでしょう.

 

雑草の分布や生態をドローンで観てきた経験からすると,やはり一番の違いは,「面的にデータを取れる」ってことじゃないですかね.

定量的な面的データから,空間動態の解析はしやすくなりました.

田起こし・代掻き・田植え・施肥・中干し・除草・稲刈り,などなど,田んぼ仕事は基本的に,田んぼに面的に働きかけるものです.

(園芸や畜産とかだと各個体に働きかけるので面的とは言えませんが,園芸作物や家畜もまた農地の面的な広がりの中で育つので,面的データは価値を持つでしょう)

植物の状態や農作業の効果を評価するのに,これほどありがたい道具もないでしょう.

 

大した広さでなければ,それこそ絨毯爆撃式にくまなく歩けば調査できるけど,

これがでっかい田んぼや河原や山とかになれば,そんなの時間と手間が追いつかないわけで.

しかも,歩いて調査するのが危険だったり,踏み込んだら調査地を撹乱してしまうような状況では,やはりドローンの出番ということになるでしょう.

「植生を壊さずに継続してデータが取れる」のも大きな利点です.

 

あとは,衛星画像との違いでいうと,やはり「解像度」と「撮影頻度」,

つまり「面的データの時間的・空間的分解能の高さ」ってことになると思います.

センチ以下の解像度なら,田面の雑草や花なんかを検出することも可能です.

あと,地表の凹凸も3次元モデルを作ることで再現できるし,植物の生育量や生育活性も,分光反射率から推定できます.

搭載するカメラを付け替えられるのも,ドローンの利点でしょうか.

 

案外見落とされがちなドローンの弱点としては「飛ばせる場所とタイミングにけっこう制約がある」ってことです.

雨風を避けるのは基本.衛星画像だって雲があると何も見えないわけですが.

あと,高圧電線や幹線道路・鉄道・民家・飛行場があるところは避けなきゃならない.

基本的に,人とインフラを脅かしてはいけません.

また,当たり前ですが「真上から見えないものは撮れない」.

それと,安全に飛ばすとなると人が見てなきゃいけないので,「現場に行く手間は相変わらずだし,飛ばすにも手間がかかる」.

単純に人工は増えると思った方がいいです.

ドローンでできることが,果たして自分の目的に適っているか,決して少なくないコストやリスクに見合うだけの利益をもたらしてくれるか,冷静に考えなくてはいけません.

 

ドローンなんてもう珍しくもないのだし,使うこと自体には何の価値もありません.

道具の一つとして,研究や営農にどう役立てるか.

それをディレクションできるかが,研究者にも普及員にも,ドローンメーカーの営業さんにも求められていると思います.

雑草と食べものから学ぶこと

だいぶ更新が空いてしまいました。

少し近況を書きます.

 

2021年春に福井県に戻りました。

今は酒米の品質向上という思いがけない課題をいただき,心機一転で励んでおります.

米粒の形状や構造が,登熟過程にどう影響されるか.非常に面白いテーマです.

またお酒というテーマ自体,その地域の気候・風土と技術・文化が問われる、総合科学だと捉えています.

 

信州ではリモートセンシングで雑草の空間動態を見てきたわけですが、

雑草を見る上で大切なのが、バラつきをどう扱うか?です。

何故ならバラつきこそ、雑草の強かさの一部と言えるからです。

もしも種子が均一で、同じ温度・湿度に置かれることで一斉に発芽したらどうなるか?

種内競争は激しいわ、日照りや寒の戻りが来たら全滅するわで、非常にリスキーです。

一方、イネの育苗だったら話は変わってきます。

同じ日に蒔いて同じように加温した種籾の生育がバラバラだったら、田植えがやりにくくってしょうがない。

作物は人間による選抜の過程で、野生ではあり得ないような均一な集団となりました。

しかし、それでも生きもの。個体ごとに差はあるし、個体の中でも早く咲く花と遅く咲く花があって、登熟にもタイムラグが生じます。

あんまりバラつくと、今度は加工や調理の時に厄介です。火加減、水加減、塩加減をどこに合わせたら良いかは職人にとっても悩ましい問題です。

しかし一方で、バラつくことによってそれらを混ぜた時にちょうど良い配合になるということもあるでしょう。

バラつきが美味しさにどう影響するか、非常に面白いテーマです。

 

バラつきを丁寧に扱うなら、ちゃんとデータの分布を見なきゃいけません。

分布を見ることで、その背後の構造とその変化を想像することができます。

そういう意味では、パラメータにも確率分布を持たせるベイズモデリングの考え方は、雑草にも食品加工にも適していると思うのです。

 

栽培植物は、生物としては均一ですが、原料としては逆に不均一という、微妙なところにいます。

だからこそ、生育、収穫、貯蔵、流通、加工、調理、実食といった田畑から胃袋に至る過程の中で、その確率分布を追っていく必要がある。

顕微鏡を覗いたり画像解析をしたりしながら確率分布を想像し、それをモデルで繋いでいく時間は、自分の仕事を一番美味しくいただけている気がしています。

「何も無い」とか,アホぬかせ.

九月を以て伊那谷での三年にわたる修行を終えまして,

今年度いっぱい半年間だけ,九州宮崎に来ております.

 

で,どこの地域に行っても地元の人が言うのは

「ここは何にも無い」ってなこと.

 

宮崎なんて,有名な人誰も出てないし・・・何言ってんの.

財部彪と若山牧水温水洋一を輩出しておいて,その言い草は無いだろう.

大体,こんなに長く砂浜が続く風景自体,珍しいんだからな.

越前生まれの私にとっては,海といえば二時間サスペンス的な断崖絶壁なんだから.

でも,そういう地形が生み出す生態系や風景もまた,私は好きだけどね.

 

ズバリ言っても良い?(福山雅治風に)

地域に魅力が無いんじゃない.

そう言う人に愛とセンスと教養が無いだけだ.

 

土地には地球の変動の歴史が表出しているわけで.

そこにある程度の期間人が住み続ければ,文化も根付くわけで.

それを無と断ずるのは,墓石を平然と踏みつけるようなもの.

謙虚さとは対極にある,極めて傲慢でバチ当たりな考え方だと思う.

 

芸能人でも,一個一個のパーツはそれほど良くなくても,全体としてカッコいい人やキレイな人はいて,そういう人は代えが効かない.

しかも,そういう人は三十過ぎてから人気が出ることが多い.

日本の各地域はそれぞれ長い歴史があるんだから,目立つものやわかりやすいものを切り取るような安いアピールは止めた方がいいと思う.

 

魚沼産コシヒカリに,沖縄産アグー豚に,枕崎産鰹節に,田子産ニンニクを使用しております・・・って,

食材としてはどれも立派なものだし,それで何を作ってもとりあえず味は良いだろうけど,そこに何の物語があるのか.

地域おこしとは,フランケンシュタインのパーツを東京に供給することじゃない.

そこにあるものの物語を紡ぎ,体験を共有することだ,と私は思う.

 

「なぜこれがこの地域で食べられているのか?」「何がこれを美味しくしているのか?」を分析的に追求する.

同時に,実際にその地域に行って得られる体験,ライブでしか味わえない感覚を伝える.

で,私はどちらかというと,前者の方が得意な気がする.とはいえ,後者もやらんといかんだろう.

喋りやイベントは,あまり欲張らずに目的を明確にすれば,それほど怖がるようなものでもないらしい,ということを最近知った.

地道に調べて,表現していこう.

匠の技とは何ぞや

かつて堀江貴文氏が「料理人になるのに何年も修行する奴はバカ」と発言し,物議を醸した.
随分な言い草だとも思ったが,彼の言いたいことも分かる.
「匠の技」というのは,とかく聖域として扱われやすい.
しかし,実際どうなのだろう?
職人の持つ技能は,他のより効率的な学習によって部分的にでも置き換えられないのか?

 

確かに,職人の作るものや仕事ぶりには,毎度惚れ惚れとさせられる.
料理人は客を観察して性別や体格,利き手を把握し,味付けや盛り付け,配膳の仕方まで気を配る.
紙漉き職人はその日の気温や湿度によって,ネリの配合を微妙に調節する.
これは知識だけでは不可能で,相応の場数を踏まなきゃできない.

スマート農業に対する否定的・懐疑的な見方の多くに,匠の技を神聖視する姿勢が見え隠れする.
すなわち「長年の経験に裏打ちされた仕事が,機械なんかにできてたまるか」というような論調だ.
特にAIの発達は人間にSFじみた不気味な印象を与えるようで,
チェスや囲碁のソフトが人間のチャンピオンを負かしたというニュースを,手放しで喜ぶ気にはなれないという人が多いだろう.
それと同じ不気味さを,スマートなんちゃらという言葉から感じ取る人がいても無理はない.

 

しかし,全ての農家がスマート農業を導入しなくてはいけない理由は,どこにもない.
ここは機械で代替してもいいな,と思うところに導入すればいいのだ.
問題は,「いいとこどり」しにくい現状にある.
大手メーカーが作るシステムは多くの機能が標準搭載されていて,欲しい機能だけを導入することが難しい.
そのぶん導入コストが高くつくことになり,これが中小農家に広まらない一因だろう.
必要十分な機能をビュッフェ形式で組み合わせられるようにすれば,新たな市場が開けると思う.
自分たちが使う技術なのに,その開発でカヤの外に置かれれば,誰だって面白くない.
カスタマイズを容易にすることで,農家の職人魂を刺激することができれば理想的だ.
同時に農業技術を研究する者は,どういう形態の農家を対象にしているかを常に意識しなくてはならない.

 

実際,職人といえど機械化の恩恵を部分的に受けているものだ.
料理人も麺を茹でる時間はタイマーできっちり計る人が多い.
だからと言って,客の入りに応じて自動で麺を茹で,盛り付けや配膳までする機械を欲しがるだろうか?
そういう業態の店があってもいいが,それをすることで失われる価値もまたあるはずだ.
だが実際,回転寿司はそれに近いことをやって一定の成功を収めている.
職人は客と顔を合わせることもなく,工場のようなベルトコンベアーを使い,プラスチックの皿で寿司を食わせる.
タッチパネル横のスピーカーが皿が来ることを必要以上の音量で喚き立てるので,まるでゲーセンのような騒々しさだ.


また,料理人のほぼ全員が洗濯物は洗濯機に放り込んで脱水まで全自動,という具合だろう.
「洗濯も手洗いに限る,機械なんぞに任せられん!」などと言うのはよほどの変人である.まあ,好きにしてくれて構わないが・・・
例えば農地周りの草刈りや獣害対策などは,多くの農家にとってできれば手をかけたくない分野に違いない.
そういう分野には,スマート技術を導入する意義は大いにある.

 

私自身,たまに陶芸をやる.
多少の金を出せば,私が作る茶碗や花瓶よりよほど良いものが買えるだろう.
下手くそな素人が作るのは,時間的にもコスト的にも効率が悪すぎる.スマートさの欠片も無い.
ただ,陶芸をやることで私が求めているのは,単に茶碗や花瓶という「モノ」ではない.
作る「過程」や使う「体験」を欲しているのである.
農業にも,いやどんな仕事にも,そういう側面はあるだろう.

 

スマート技術を追求することは,「経験することの意味」を問うことなのかもしれない.

ものがたりたがりばかり

まなじ使えるデータや情報が増えると,なんでもかんでも,とかく結びつけたくなるもの.
壮麗な宮殿のような立派なモデルができると,仕事した感満載ですもんねー.
せっかく集めたデータを使わないともったいない気もするし.

どうしても人は物事を因果関係で結びつけた物語を創作する癖があるようで,
かくいう私もそう.「最近の学生は」とかつい思っちゃう.
年をとると尚更面倒くさがって,わかりやすいストーリーを作りたがるのかも.

数式やプログラムが書けたりするとそれをモデルに組み込みたくもなるんですけど,
そこは冷静に,AICでもRDでもベイズ ファクターでも使って,
重要じゃない変数をオッカムの剃刀でバッサバッサ切り捨てていくべきでしょう.

統計学者のオーリー・アッシェンフェルターらが作ったボルドーワインの価格のモデルは,こんな感じ.
「ワイン価格 〜 前年10〜3月の降水量 + 8, 9月の降水量 + ワインの年齢」
試飲しなくても気象データから価格の見当がつく,というもの.
この単純なモデルの前に,多くのワイン評論家が敗れ去りました.
「ワインは試飲してみなきゃわからない」って,専門家もみんなも思い込んでたんです.
だって,そんな感じするもん.

もちろん,この単純なモデルを作るためには膨大なデータが必要でした.
最後に残ったモデルが,少ない変数しか必要としなかった,というだけです.
モデルの変数が少なければ,運用時のデータを集める手間は省けます.
こういうモデルで農作業や生態系管理の支援をしたいものです.

モデルに人間と同じような過程を踏ませる必要はありません.
要は「人間と同等かそれ以上の結果が得られればいい」のですから.

「荷物を拾う確率は,他の荷物が周囲に少ないほど高くなる」
「荷物を下ろす確率は,他の荷物が周囲に多いほど高くなる」
という2つのルールのみに従うロボットを数台,荷物がバラバラに置かれた部屋でランダムに動かすと,
やがて部屋の中の数カ所に荷物がまとめられた,という実験があります.
こういう心配になるくらい単純な仕組みが案外,人間をルーティンワークから解放してくれるかもしれません.

 

で,人間が拵えがちな物語の中で一番安直で危険なのが「頑張ればうまくいく」.
こういうことを言っちゃいけない.特に大人が子供に対して言っちゃいけない.
いちいちご大層な「達成感=努力と成功の因果関係」を求めて,頑張ることが目的化して,
報われなかったり否定されたりすると不貞腐れる,面倒くさい大人になりかねない.

民間企業では,売上前年比○%増を目指すぞ!なんていう目標の立て方をするところが多い.
では統計学の本を開いてみましょう.時系列データの構造はどうなっているでしょうか?
「時系列データ = 短期の自己相関+周期的変動+トレンド+外因性+ホワイトノイズ」
このうち営業努力でどうにかなるのは,
「トレンド」を伸ばすか,別の市場に移って「外因性」を変えることくらい.
それなのに売上データをロクに分析もせずに目標立てて頑張るぞ!って,誰得なんですか?

頑張るのは当たり前.それでもうまくいかないことがある.
そこで別のことをやるかしつこく続けるか,じゃないですか?

ゴルゴ13」のデューク東郷は仕事の成功のために必要な要素として,
「10%の才能,20%の努力,30%の臆病さ,40%の運」
を挙げています.
もちろんこれは個人の見解ですが,東郷は経験からこのようなモデルを構築したようです.
凡百の少年漫画とは違って綺麗事はヌキ.これぞ大人ですね.

「うまくいこうがいくまいが,やるべきことをやる」の方が,よっぽど自然だと思います.

 

参考文献
O. Ashenfelter, D. Ashmore & R. Lalonde (1995) Bordeaux Wine Vintage Quality and the Weather. CHANCE, 8:4, 7-14.
J. L. Deneubourg, S. Goss, N. Franks, A. Sendova- Franks, C. Detrain and L. Chretien (1991) The dynamics of collective sorting robot-like ants and ant-like robots. Proc. of the 1st Int. Conf. on Simulation of Adaptive Behaviour, pp.356-365.
馬場真哉(2018)『時系列解析と状態空間モデルの基礎』プレアデス出版
さいとう・たかを(1988)『ゴルゴ13 (66)』リイド社

データのバイアスを如何せん

前回,データを収集・共有するのは今やごく当たり前で,
これからはそれをどう解析して実際の行為に結びつけるかが大事だ,という話をしました.
そのためには,データの性質に合わせた解析方法を選ぶ必要があります.

 

そもそも,僕らはどうやってデータを得ているのでしょうか?

 

気象データなら,各地に設置したセンサーで気温や湿度や気圧を計測します.
実験データなら,電子天秤や吸光度計などの測定装置の値を読み取ります.
野外調査データなら,観測者がフィールドを歩き回り,ひとつひとつ記録していきます.
これら従来のデータは,装置の性能や観測者の力量によってある程度の精度が担保されています.
だからこそみんな「母集団から抽出したサンプルについて,正確な情報を得た」という前提で解析をするのです.

 

しかしこれらのデータも,必ずしも寸分違わぬ数値ではありません.多少なりともズレているものです.

こういう誤差はできれば排除したいものですが,限界はあります.

自然界には,観測誤差以外にもばらつきの原因になる要素がたくさんある.

そのばらつきが大事だったりするので,そういう時には観測誤差とその他の要因を分けて考えたい.

例えば雑草の発芽のばらつきは重要な生存戦略なのに,観測誤差と混ざっちゃって結局よくわからなかった,っていうんじゃもったいない.

観測の際にどんなバイアスがかかっているかを想像し,それを数学的に表現できれば,誤差をモデルに組み込むことができます.

 

データを取ったときの方法や状況が分かれば,どんなバイアスがかかっているか想像できますが,

ビッグデータではそういうわけにはいかないことがあります.

SNS上のリア充アピールや病みツイートも,今や立派なデータになり得ますが,

それがどんな人によって,どういう状況で発信されたかがわからないと,データの質や構造がわからないのです.

「iNaturalist」のデータにしても,AIによる画像判別の精度も上がってきたし,キュレーターという分類の専門家も入ってくれているとはいえ,
そのデータを分布解析に使う際には,その構造に注意した方がいいでしょう.

極端にいうと,素人100人が東京の公園で集めた植物の分布データと,植物学者が単独で北アルプスを縦走して得た高山植物の分布データとでは,
データの質や構造が違います.

 

生物の分布データは,観測の際の精度に制約が大きい.

そこで,数理生態学者のダリル・マッケンジーは、観測時の発見率を明示的にモデルに組み込むことを提案しています.

しかしこれだって,データの構造がわかっているからこそ.

さらに,その発見率は努力量(調査にかけた人手と時間の積)に依存しますが,専門家1人と素人1人を同じにカウントするわけにもいかんでしょう.

やはり,どういう条件でデータがとられ,誤差が何によって生じているのかを気にする必要があります.

 

いくらビッグデータと言っても、データの構造が分かりやすいものから利用していくと良いでしょう.

データの質が担保されているとか,観測者の層が限られているデータです.

 

一方で,ビッグデータを活用する方法も探っていくべきでしょう.

最近,ビッグデータ誤差構造を理解するには,認知科学的なアプローチが参考になるんじゃないか,と思っています.

 

例えば、この前の学生実習で「iNaturalist」を使って信大農学部構内の植物のマッピングを行いました.

馴染み深いものからマニアックなものまで,10種類の雑草を探してくるよう学生に指示したのですが,

事前に言い添えるコメントしだいで,探す際の行動が違ってきます.

「よーく探してみてね」と言えば,少ししかないものだと思ってひとつ見つけたら満足してしまうし,

「いっぱいあるやんけ」と言えば,もっとあるんじゃないかと思って他にも探そうとする.

結果的に,事前の情報に引っ張られたデータになるわけです.

こういうふうに事前の情報によって判断が引っ張られるのを,心理学では「アンカリング効果」と呼ぶそうです.

思えば,野外調査ではこういう状況はしょっちゅうある気がする・・・

意図的に情報を与えなくても,先入観は各々持っているものだし.

多少面倒でも,データを取る前に目を慣らす時間を設けるとか,工夫したいものです.

 

参考文献

MacKenzie et al. 2006. Occupancy Estimation and Modeling: Inferring Patterns and Dynamics of Species Occurrence. Academic Press, Burlington.

Kahneman 2011. Thinking Fast and Slow. Farrar, Straus and Giroux, New York.

研究者の仕事って何?

論文を書いていてふと思ったこと.
データ集めて解析して論文書いて・・・だけじゃ物足りないなあ,と.

 

論文は、コミュニケーションのための媒体です.
誰とのコミュニケーションか?といえば,主に「研究者」です.
ただし,ここでいう「研究者」とは,仕事で研究をやってる人だけでなく,ライフワークとしてやっている在野の研究者や愛好家も指します.

特に「分類学」「天文学」「考古学」「歴史学」「民俗学」「文学」「哲学」のような分野では,プロだけでなく在野の研究者や愛好家が活躍してきました.
(その中のスター的存在が,エリック・ホッファー南方熊楠です)
しかし,それは逆に言えば「それ以外の分野には,仕事で研究やってる人でないと手を出しづらかった」ということでもあります.
とりわけ,高価な装置や組織的な調査を必要とするテーマは,プロでないとなかなか手が出せなかった.

 

時代は変わりました.
情報の「共有」「解析」「発信」を今までよりはるかに速く,安くできるようになってきました.
調査データの共有は進んできていて,データの所在や利用方法を掲載するデータジャーナルというものもあれば,「iNaturalist」のような誰でも参加できるプラットフォームもあります.
オープンデータってやつですね.

でも,データやその集め方を共有するだけで十分なのか?
例えば昆虫少年を増やすことにはなって,それはそれで素晴らしい.
でも,そうやって探すことや調べることそのものに熱を上げられる人はごくわずかで,調べたことから何が言えるか?を示せないと,なかなか続かないのが現実です.
また,悪くすると研究者が市民をデータ集めのコマとして使い,そのデータで論文を「書き逃げ」するだけになりかねない.
そこからさらに踏み込んで,得られたデータを解析して,何が言えるか?までを研究者と市民が一緒にできれば,フィールド研究は次の段階に行けると思うんです.

 

僕らがやっている生態学は,生きものの生き様に純粋な興味を持ちつつも,その生物や生息環境をどう保全・管理していくか,という実際的な問題にも取り組んでいます.
そうなると,研究者間のコミュニケーションだけでは不十分で,実際の管理を行うことになる一般市民や業者さんたちともコミュニケーションが必要です.
そのコミュニケーションの中で,本当に痒いところが何処にあって,そこを掻くために何ができるかを一緒に探ることができます.
で,今はデータの共有にかかるコストが下がり,表現方法も多様化してきている.
これまでできなかったコミュニケーションができるに違いない.

 研究の仕事を分解すると,
・課題設定
・データ収集
・データ解析
・コミュニケーション
という具合になります.
これら一連の過程をデザインすることが,これからのフィールド研究者の大事な仕事なのではないでしょうか.
そうなるといま必要なのは,オープンデータを想定したデータの収集・解析の手法を研究し,普及することです.

 
先だって,雑草などの生物の分布を解析する用のjagsコードを「GitHub」に公開しました.

github.com
空間分布の二値データがあれば,その出現,死滅,侵入の確率を推定できます.
植物などの固着性の生きものを想定しています.
(説明書きがもう少しないと扱いづらいですよね,スミマセン・・・)
これのおかげでドローンの画像からクズの分布の変化をモデリングできたので,論文を鋭意執筆中です.

ただ,在/不在の二値データって,市民がやるにはちょっとハードル高いんですよね.
一度見れば「いる」ことはわかるが,「いない」ことを確認するには調べ尽くさないといけないから.
だから,日常の中で得られるデータは,大抵「在のみデータ」です.
そのためには.過去の記事でもお話しした「最大エントロピーモデル」を使って,在のみデータから生きものの分布を推定する方法があります.
これを使った論文が最近増えていますので,私もこれで外来雑草の分布推定をやりたいと考えています.