Technology

人工知能と進化分子工学を高度に融合させた高機能タンパク質創製技術「aiProtein®」
遺伝情報から翻訳され、生命機能を司る分子として生みだされるタンパク質は、アミノ酸が連なる一本の鎖です。たった20個のアミノ酸が並ぶだけで、宇宙の星の数(約10の23乗)に匹敵する数の配列が生まれます。平均的なタンパク質は、アミノ酸が300個並んだもので、その配列の多さは途方もない数(約10の390乗)になります。進化分子工学は、この途方もない空間を探索する方法として開発され、タンパク質工学に新しい道を開きました。RevolKaは、この進化分子工学に機械学習を中心とした人工知能を取り入れることによって、これまで以上に広い空間を確実・迅速に探索する技術を開発しました。
Revolkaの強み

進化分子工学と人工知能の高い次元での融合
aiProtein®は、広大な配列空間を効率よく探索するために、実験データの品質と人工知能による精度の高い予測を高次元で融合しています。通常、人工知能の教育には多数のデータが必要となりますが、aiProtein®では、約100個という少数の実験データで高い精度の予測を可能としています。これにより時間と労力の大幅な削減を実現し、生物学的に複雑な評価系にも対応可能となりました。
aiProtein®は、①探索エリアの選定、②配列空間の特徴を知るための実験データの取得、③機械学習用データへのプロセッシング、④人工知能の教育と有望変異体の予測の4つの工程からなります。aiProtein®の高い効率は、バイオ実験特有のデータのエラーを低減し、機械学習の予測精度を最大限に向上させることで達成されています。RevolKaは、これまでに多数の成功実績を持ち、これはaiProtein®がバリデーションされていることを証明しています。
aiProtein®とは
RevolKa技術aiProtein®ができるまで

aiProtein®は、進化分子工学、タンパク質工学の分野において多くの実績を持つ東北大学の梅津教授と、AI・IT業界を牽引する3名の先生方との強力なコラボレーションによって誕生しました。バイオとITとの融合に懐疑的な声も多かった時代から、各分野を代表する研究者が議論を重ねながら磨き上げてきた技術です。
参考論文
ACS Synth. Biol. (2018) 7, 2014-2022
ACS Catal. (2021) 11, 14615-14624
aiProtein®技術の貢献者
外部アドバイザー


従来の進化分子工学との比較
従来の進化分子工学では、狭い範囲を繰り返し探索し、目的とする改変タンパク質を得ていました。この方法により多数の成果が得られましたが、局所解に陥る危険がありました。一方で、aiProtein®では、配列空間からランダムに100程度のデータを作成し、その情報から機械学習を用いて配列空間全体のランドスケープを予測します。これにより、配列空間全体を俯瞰して探索することができるようになるため、効率的かつ確実に真の目的解に到達することができます。


aiProtein®のキープロセス
aiProtein®は、2ステップで行われます。まず、配列空間を適切なサイズまで絞り込みます。この絞り込みの方向性により、その後の成功確率が大きく変化するため、ノウハウを十分に盛り込んだ慎重なデザインを行います。次に、絞り込まれた配列空間の特徴を捉えるため、ランダムなデータのサンプリングを行います。この時必要となるデータ数は絞り込んだ配列空間の規模とバランスをとった設定が必要となります。調和のとれた2ステップからデータを作製することで、機械学習は正確にランドスケープを予測できるようになります。

aiProtein®による同時最適化
同時最適化は、aiProtein®の確固たる強みの1つです。配列空間上のランドスケープは各特性ごとに独立しています。そのため、従来の進化分子工学での逐次的な探索では、一つの特性の向上により他の特性が犠牲になることが多く、複数の特性の向上を同時に満たすタンパク質を発見することは困難でした。一方で、aiProtein®では、各機能ごとに用意したデータを用いて機械学習することにより、人工知能が全てを集約したランドスケープを予測します。これにより、複数機能の同時最適化が可能になります。
aiProtein®による実証データ

緑色タンパク質からの高輝度黄色タンパク質の創製
aiProtein®により、緑色蛍光タンパク質(Green fluorescent protein:GFP)をもとに、強い黄色蛍光を発するタンパク質の取得に挑戦しました。まず、発光に関わる部位を特定し、探索範囲を決定した後、約100個の変異体データ(グレー色)を作成しました。続いて、そのデータを教師データとして機械学習を行いランドスケープを予測しました。その結果、強力な黄色蛍光を発する変異体(黒色)を特定しました。GFPの30年の研究史上、最高の黄色蛍光強度を持つ変異体(赤色)を、たった7日で見つけだすことができました。

高活性酵素の創製
aiProtein®により、酵素の活性を向上させる課題に挑戦しました。まず、酵素活性に重要な部位を特定し、探索範囲を決定した後、約100個の変異体データを作成しました。続いて、そのデータを教師データとして一度目の機械学習を行いランドスケープを予測しました。その結果、高い発現量を示し、 約5倍の活性を示す変異体の取得に成功しました。ここで得られた変異体をもとに、2サイクル目の機械学習を試行したところ、高活性化の飽和傾向が見られたことから、一度の機械学習のみで、十分に目的機能の最高値付近まで到達できていることが明らかになりました。
To be disclosed
aiProtein®の技術の展開

テーラーメイドデザイン
aiProtein®の同時最適化という突出した強みを応用し、様々な目的や特性に合わせた絶妙なタンパク質改変が可能です。各パラメータごとに、 進化の方向性(向上/維持/低減)が細かく異なるような複雑なデザインにも巧みに対応可能であるため、医療業界、化学業界だけではなく、様々な業界で活躍できるタンパク質を創出できると期待できます。

医薬品の研究開発、利便性拡大
aiProtein®による物理化学的な特性の向上は、タンパク質医薬品の高濃度化による皮下投与製剤化(自己注射剤)や、常温流通化による冷蔵システムの不要化など、製品競争力の向上に貢献します。また、モデル動物タンパク質への交差性向上は、Data translatabilityを向上させ研究開発を加速させます。さらには、独創的タンパク質分子の創生は、難治疾患治療法の提供につながると考えられます。このような多くの価値の創出により、多くの患者様や医療関係者の皆様の笑顔溢れる毎日に貢献したいと考えています。

幅広いモダリティ
aiProtein®は、アミノ酸で構成されている全ての分子に対応可能です。すでに、様々なフォーマットの抗体(IgG, scFv, diabody, bispecific antibody etc.)やペプチド、酵素やワクチンを含むバイオロジクスでの実績があり、aiProtein®の応用可能性の広さを立証しています。多種多様なタンパク質の改変に取り組む中で、RevolKa独自のノウハウとスキルを着実に構築してきており、タンパク質分子だけでなく、aiProtein®自身も日々進化を遂げています。今後も進化を加速させ、将来的には遺伝子治療を含む未開拓のモダリティにまで展開していくことを目指しています。
パートナーシップ(共同研究)

RevolKaは高機能タンパク質を必要とする医薬、食品、ケミカルなどあらゆる産業においてパートナーを募集します。RevolKaの掲げる、最先端バイオ製品のコアとなるタンパク質を人工知能で育て進化させ提供することにより世界の人々の「健康」と「豊かさ」に貢献する というミッションに共感していただける皆さま、バイオ産業の「フロンティア」を共に開拓していただける皆さまからのご連絡をお待ちしております。詳しくは、コンタクト先までお問い合わせください。