マハラノビス距離と社会科学

折原浩先生のいわば「弁証法的」理念型解釈を批判しましたが、ではお前はどう考えるのか、歴史や社会をどういう方法で解釈・分析するのかと問われたら、私はマハラノビス距離のような多次元ベクトル(多変量)空間の考え方を取るしかないかと思います。マハラノビス距離というのはインドの数理統計学者のマハラノビスが考案したもので、元々は未知のマンモス等の骨の化石をどういう種のものか同定するために考案されたものです。ある骨の分析をしてその特性(重さ、長さ、密度、色、硬度、原子構成、形状、等々)の多次元ベクトルマップを作り、既に同定が済んでいる別の化石のベクトルマップと比べ、それぞれの平均値(全てのベクトルを平均した重心のようなイメージ)同士の距離を比べて、一番近いものがその骨の正体である、という方法です。
私はこのマハラノビス距離については、2つのことで知るきっかけを得ました。
(1)田口メソッド
品質管理や製品開発の技法として実験計画法というものを田口玄一博士が考案し、これが田口メソッドと呼ばれています。この田口メソッドは昔は日本よりも海外で有名でした。昔化学メーカーで半導体材料を売っていましたが、インテルやモトローラといった大手の半導体会社は重要な部材のサプライヤーに対して、最低1年に1回以上の工場監査を行います。そういう時に監査資料の質問の日本語訳、逆に回答の英語訳という仕事を若い時には良くやりました。そういった監査の際に良くあった質問として「お前の会社は新商品開発などで田口メソッドを使っているか」というのが結構な頻度で入っていました。その当時、日本では一部の人(私が在籍していた会社では工場長レベル)は田口メソッドを知っていましたが、海外ほどではありませんでした。その田口メソッドの発展でMT法というのがあり、このMがまさにマハラノビスであり(Tは当然田口)、多次元情報データによる予測、診断、分析法です。
(2)類似文書検索ソフトウェア
以前在籍したソフトウェア会社で、類似文書検索システムというのを販売していました。開発したのはアメリカの会社ですが日本語への対応を私がいた会社が行いました。これがまさにマハラノビス距離を使っていて、文書を形態素解析して品詞に分解し、名詞系の単語の分野(人名、地名、商品名、法学用語、IT用語等々)を使ってどんな分野でどれだけの数の単語があるかを計算し、それで同じように多次元ベクトル空間を作って、それと検索対象の文書のベクトル空間とのマハラノビス距離を取って、それが近ければ類似文書とみなす、というアルゴリズムでした。このソフトはFAQの検索システムなどで良く使われていました。

こうした考え方を社会科学に応用すれば(経済学では既に応用されています)、理念型(=一つの次元)の設定はある意味多ければ多いほど良い訳です。そしてそれぞれをヴェーバー的決疑論で精度を上げ、最終的に多次元ベクトル空間として分析すれば、歴史の中でのAの文明とBの文明をよりよく比較するということがある程度可能になるのではないかと思います。まあ思い付きの域を出ていませんが。ヴェーバーがインドや中国の宗教を研究したのは、折原浩先生の説明によれば「プロ倫」をラッハファールに批判されて「プロテスタンティズムの倫理と資本主義の精神は単に親和関係があるぐらいとしか言えない」というのに対し、「思考実験」としてプロテスタンティズムの倫理が無かった国々を調べた、ということです。しかし、思考実験が本当の意味での実験でないのは言うまでもありません。実は自然科学の分野でも完全な実験(多数あるパラメーターの内、比較されるものから一つのパラメーターだけを変えて、その結果がどうなるか見る)を行い得るケースは非常に限定されています。例えば医学の世界で、ある薬がコロナウィルスに効くかどうかの実験で、その薬を飲んだかどうか以外は全ての条件が同じ複数の人間を用意するのが不可能なことは誰でも知っていますし、また2つの実験群の内片方にプラセボ(偽薬)だけ与えてどれだけ死亡するか見る、という非人道的な実験も不可能です。そういう場合は、統計学的な処理で「推計」をするしかありませんが、社会科学でも同じことだと思います。