はじめに
化学製品の開発の話です。
背景
日本の化学産業における「材料」というのは、だいたいの場合色々な原料の混ぜ物、つまり組成物を指します。
なぜかというと安く作れて高く売れる素材はだいたい高分子材料であり、高分子材料はたいていの場合単体では使わず、混ぜ物をして必要な特性を付与する必要があるためです。混ぜ物のノウハウによって付加価値をつけているということですね。
下の公開公報(適当に検索したやつ)を例にすると、主材料(PBT)と添加物の構成を変えて、印字性や機械強度のトレードオフを評価しています。材料の明細書というのは大体こんな感じで組成表が載っているものです。
特開2023-114412 「樹脂組成物、成形体、および、レーザー溶着体」 (三菱ケミカル)
https://www.j-platpat.inpit.go.jp/c1800/PU/JP-2023-114412/FCBB365058AE0C100FC595AE6195C81C8D6B659E34B331DC508A2FA77C0DE0E2/11/ja
昔、「実験条件とデータの場所データベース」を職場で作ったとき、すでに「化学とAI」のような記事や書籍は世にあふれていましたが、 それ以前にデータを集約する仕組みをどのように実装するのか? に関する情報はぜんぜん出回っておらず、かなり苦労した記憶があります。
多くの化学品の開発が「混ぜ物の構成を変える」というある種共通のフォーマットを通して行われるのにも関わらず、これをデータベース化するためのノウハウが世の中にあまり出回っていないというのは何とも奇妙なコトだと思いました。
前置きが長くなりました。ということで「混ぜ物の開発を集団で行う場合に、効率的(かつ楽な)なデータ管理法を実装するための一般的な方法を考える」というのがこのシリーズのテーマです。
目的
そもそもなぜデータを検索可能な状態で集約しないといけないのか、もう少し整理してみましょう。
仮に一人でデータベースを実装する高度な能力があったとしても、ほかのメンバーにその仕組みを強制する必要がある以上、ある程度の論理武装は必要です。
適切な判断をするため
データが集約されていないと、実験を設計する技術者の意識にはごく限られた直近のデータしかありません。
したがって、それまでのデータを俯瞰してみる手段が実質的に存在しません。
こうなるとGPSも地図もなしで目的地に着こうとしているようなもので、
①現在の検討の方向性が正しいのかどうか判断できない
②実験空間の大きさを適切に設定できない
③技術者のバイアスが定量的に検証されることがなく、アドホックな(その場限りの)通説が形成される
といった問題が起こりがちです。
当然ですが実験の結果は「うまくいった/だめだった」だけでなく、定量的に評価されその後に判断に活かされるのが理想です。データベース化はその強い味方になります。
本質的なことに時間をつかうため
手分けして検討を進めている場合、会議のほとんどが情報の整理に費やされ、次のアクションが決まらないまま時間が過ぎてしまうことはよくありませんか?情報の整理、確認という研究開発的な価値を生み出さない作業に時間がかかるような状況では、「次に何をすべきか」という本質的な議論になかなか本腰を入れて取り組むことが難しくなります。
方針
無理なく情報がたまる仕組みにする
「実験のデータベース作りました!使ってください!」といっても(リーダーが協力的でない限り)普通はスルーされます。面倒ですから。
そこで、できるだけ使用者の心理的負担を軽減した形で実装する必要があります。
・実験の起票と同時にデータベースへ登録される仕組み (標準化、自動化)
・結果の解析と同時にデータベースへ登録される仕組み (標準化、自動化)
・痒い所に手が届く集約・検索機能
があるといいでしょう。
小さい範囲ではじめるorまず簡単なものを作ってしまう
この種の「仕事のやり方を変える」方法は多くの人を巻き込む必要がありますが、まず間違いなく難航します。いろいろな考えを持った人がいますから、こういうことに不安や反感を持つ人も中にはいます。過去にトライしてみたが、結局破綻しまい懐疑的意見を持つ人もいるかもしれません。
そこで、もし意思決定権を有する人を味方につけられていないのであれば、自分のいるチームだけ等の小さな範囲から始めるのも手です。そこから草の根作戦で徐々にいい評判を広げていけばよいでしょう。
あるいは、フォーマットの統一がある程度できているのであれば、ある程度機能するデータベースをまず作ってしまい、その後普及していくことも考えていいと思います。
私が昔作った実験データベースはこちらのタイプでした。同僚が皆決まったフォーマットの実験計画書をコピペで使いまわしていたので、そこから情報を抽出・整形し、別途作った主原料データベースの情報と合わせ、1件のレコードとしてAccessで作ったデータベースに放り込んでいく形にしました。
このデータベースはかなり好評だったんですが(自画自賛)、同時に「以前は過去データを検索できる意義がよくわかっていなかったから、何かする手間を要求されていたら素直に従ってなかったかもしれない 」ともいわれました。確かにこういうものは使ってみて初めてその意義がわかるという側面もあり、それがこういうデータ集約の取り組みが難航する原因でもあります。このように役に立つのだ、というビジョンを早い段階でチームと共有できるのが「まずは作ってしまう」方法のいいところです。
概念図
主原料を作る→混ぜ物にする→物性を評価する のサイクルが混ぜ物開発の基本となりますから、システムの全体像としては次の図のようなものが考えられます。
(ちゃんとしたテーブル設計ではないのは許して)
まとめ
・混ぜ物材料開発ではデータベースを作ったほうがいいが、いばらの道ではある
・データ集約機能と検索UIの作りこみはしっかりして、使用者の心理的負担を減らそう
・すぐに全員に理解してもらうのは難しいので、小さく簡単に始めてみよう
次からは概念図にしたがい構成要素の具体的な例を考えてみたいと思います。