こんにちは!AI Alignment Talk from Japanの泉川です。今回はAIアライメント研究における「視点の偏り」に目を向けます。AIアライメントが比較的若く、未知のリスクを扱う研究分野であるが故の学術領域としての課題を紐解いていきます。
アライメントコミュニティの課題
AIアライメント分野を学術領域としてメタ的に分析している文献は多くはありません。考察の一つに2021年、Alignmentforumで公開されたMITの確率コンピューティングやバリューアライメント研究の博士課程、Tan Zhi-Xuan氏による記事”AI Alignment, Philosophical Pluralism, and the Relevance of Non~Western Philosphy”1が挙げられます。
Zhi-Xuan氏はAIアライメントが非常に小規模で成長中の分野であるとし、関わっている組織のほとんどが非常に若く多くの場合が設立5年未満であることを指摘しています。加えて、AIアライメントがごく最近まで学会内であまり真剣に受け止められていなかったために、学界内外でのディスカッションが多くなかったことを述べています。これらの要素はアライメントコミュニティの研究者層の多様性の低さ・分野横断性の低さ・哲学的視野の狭さに繋がっていると同氏は指摘しています。
文化・哲学・学問的多元性の必要性
AIアライメント研究コミュニティがまだ小規模であるために、研究者層の多様性が低く、学際的な交流も弱い状態にあることをZhi-iXuan氏は示し、それが本来重要であるはずの考慮事項を見逃すことに繋がると示唆しています。だからこそ、AIがどのような原則に従うべきなのか、それらをどのような方法で決定するのかなどという問いに対して「多元主義」を取り入れる必要があるとしています。
その実践例としてOpen PhilanthropyのHolden Karnofsky氏の”World Diversification”2にある言葉を挙げています。
“When deciding between worldviews, there is a case to be made for simply taking our best guess, and sticking with it… However, that’s not the approach we’re currently taking. Instead, we’re practicing worldview diversification: putting significant resources behind each worldview that we find highly plausible. We think it’s possible for us to be a transformative funder in each of a number of different causes, and we don’t - as of today - want to pass up that opportunity to focus exclusively on one and get rapidly diminishing returns.”
「どちらの世界観を選択するかを決めるとき、単に最善の推測を採用し、その選択を固定することも考えられます。(中略)しかし、それは私たちが現在取っているアプローチではありません。その代わりに、私たちは世界観の多様化を実践しており、非常にもっともらしいと思われるそれぞれの世界観に重要なリソースを投入しています。私たちは、様々ある目的のそれぞれにおいて変革をもたらす資金提供者になる可能性があると考えており、今日の時点では、その機会を逃して 1 つの分野だけに集中し、収益が急速に減少することを望んでいません。」
とはいえ、例えば「AIがどのような原則に従うべきなのか」という問い一つ取っても対立するような価値観がすでに出てきています。(例:AIは何があっても絶対に人間に危害を加えてはいけない VS AIによってもたらされる便益が被害を上回るのであれば、多少の危害リスクは容認しなければいけない)そのような状況下でKarnofsky氏のような「多元性の共存」を受け入れることはダブルスタンダードにつながる恐れもあります。
さらに、国や世界レベルでAIが沿うべき原則についてある程度の合意をすることも求められています。道徳的な合意がない中で、AIがどのような原則に沿うべきかをAIアライメントコミュニティとして合意する公正な方法はあるのでしょうか3?
何が必要なのか
”Value Pluralism in the AI Ethics Debate~Different Actors, Different Priorities"4でRudschiesらは大切なのは「共通点を見つけることよりも、相違点や対立に光を当てることだ」としています。この論文を参考にすると、AIアライメントコミュニティに求められることは、まず、アクターの種類に目を向けることだといえます。そして、公的アクター、専門家、民間アクターなどのアクター間の相違に焦点をあて、それぞれの優先順位が議論にどう影響を与えるのかを整理することが大切だと述べられています。そうすれば、アクターごとの「最低要件」や「主要原則」が見え、アクター間で関連する可能性がある議論がわかってくると言います。
実践を考えればこのようなプロセスは時間とコミットメントを要するものでしょう。しかし、最初から共通点を見つけようと議論を急ぐのではなく、違う立場・価値観のアクターが何を求め、どこまでは譲れるがどこからは絶対に譲れないのかを理解することがAIアライメント研究を学際的に広げていく近道になるのかもしれません。
Plurality movementへの期待
様々な価値観や専門性を持った人たちの考え方が多元的に共生するような社会を目指す運動としてPlurality movementを挙げます5。Pluralismという言葉は多様な人種や性的指向、障害などを尊重すると言う意味合いで使われることもありますが、今回扱うPluralityは2022年9月に台湾のデジタル担当大臣Audry Tang氏とマイクロソフト・リサーチのエコノミストGlen Weyl氏による”Plurality: The Future of Collaborative Technology and Democracy”6に登場するPluralityを指しています。
同記事でPluralityは「社会的および文化的な違いを超えた協力を認識し・尊び・促すテクノロジー」として紹介されています7。Tang氏・Weyl氏はPluralityは世界の多くの分断を克服し、民主主義社会を支える技術になり得るしています。
その一例として挙げられるのが台湾にUberが進出した際にTang氏が開発したvTaiwanプラットフォームです。Uberに対する意見は台湾だけでなく世界中で二分されていましたが、台湾ではvTaiwanを通じて配車サービスをどのように規制すべきか、何が問題か議論することができたといいます。vTaiwanでは統計分析AIを用いて交わされた意見をクラスタリングし、プラットフォーム参加者が異なる意見の要点を迅速にわかるようにする工夫も取り入れたそうです8。
このように現状ガバナンスサイドで用いられているような多元性を試みる動きはAI Alignmentの研究開発をする上でも、役立つのではないでしょうか9。AI Alignmentの研究者同士、AIが整合すべき価値観をどのように考えているのか、近隣または関連する人文社会学系の学術分野の研究者は何を考えているのかを知り、AI Alignmentの学際性を高めていく上でもPluralityという考え方は有用であるように感じます
Pluralismと訳される多元論・多元性は”A condition in which numerous distinct ethnic, religious, or cultural groups are present and tolerated within a society.The belief that such a condition is desirable or socially beneficial.”と定義づけられているが、AI Alignmentなど研究分野でのPluralismとして応用が可能。
AI Alignment Talk from Japanでは毎週ニュースレターをお届けします。ニュースレターを受け取りたい方はこちらからSubscribeよろしくお願いいたします!
Xのフォローはこちらから!
Tan Zhi Xuan “AI Alignment, Philosophical Pluralism, and the Relevance of Non-Western Philosophy” 2021/1/1 https://www.alignmentforum.org/posts/jS2iiDPqMvZ2tnik2/ai-alignment-philosophical-pluralism-and-the-relevance-of
Holden Karnofsky "Worldview Diversification” 2016/12/13 https://www.openphilanthropy.org/research/worldview-diversification/
Iason Gabriel "Artificial Intelligence, Values, and Alignment" 2020/10/1 https://link.springer.com/article/10.1007/s11023-020-09539-2
Catharina Rudschies et al. ”Value Pluralism in the AI Ethics Debate - Different Actors, Different Priorities” 2020/3/29 https://informationethics.ca/index.php/irie/article/view/419
7月に東京でも開催予定のPlurality Tokyo。世界的に広がりを見せているPlurality Movement。
https://plurality.tokyo/
E. Glen Weyl, Audrey Tang”Plurality: The Future of Collaborative Technology and Democracy” 2022/9/15 https://www.radicalxchange.org/media/blog/plurality-technology-for-collaborative-diversity-and-democracy/ (こちらも参照:https://github.com/pluralitybook/plurality)
Ibid.
Robert Wiblin and Keiran Harris “Audrey Tang on what we can learn from Taiwan’s experiments with how to do democracy” 2022/2/2 https://80000hours.org/podcast/episodes/audrey-tang-what-we-can-learn-from-taiwan/
Audrey Tang氏率いるPlurality Institute(https://www.plurality.institute/about)では2024年2月に”A Roadmap to Pluralistic Alignment”を発表。(https://arxiv.org/abs/2402.05070)