Commentary

2024 / 2 / 21

 

ビッグデータと可視化技術

 


ビッグデータは、「Volume(量)」「Variety(多様性)」「Velocity(速度)」の3つを特徴とするデータと言われています。最近は、+「Veracity(正確性)」or +「Value(価値)を加えて4V or 5Vと言う専門家もいます。

総務省の「情報通信白書(平成29年版)」によれば、

「オープンデータ」➔ 国や地方公共団体から提供・シェアされる
「構造化データ」 ➔ 暗黙知(ノウハウ)等をデジタル化
「ストリーミングデータ」➔ M2M(Machine to Machine)から供給される
「パーソナルデータ」  ➔ 個人の属性に関係する

の4つに分類されるとありますが、予測推定や意思決定・ニーズの把握分析といった場面で使用される事からリアルタイム性のあるデータやグループ相関・隠れたパラメータを発見する事にも利用されたりしています。例えば、細胞間のエクソソームやエピゲノム、体内の蛋白質UP/DOWNは、最近注目されています。頭蓋骨から顔を復元するテクノロジーは知られていましたが、ゲノムからも復元する事が可能となっています。これは、SFやTVドラマ・映画でも紹介されたりしていますが、犯罪現場に残された遺伝情報から容疑者のモンタージュ写真が参考として合成される時代に入っています。

高品質のデータ量は色々な性質を可視化

ビッグデータは、どの程度あれば信頼性があるのか?はそのテーマや分析対象、期待される利用効果等で変化します。多重回帰分析は、マーケットリサーチで良く利用される手法ですが、目的変数・説明変数が明確であり相関が期待される場合は有効とされています。しかし、違った現象や時間変数とその状態が膨大にあり、重要な相関パラメータが隠れてしまっている場合は、その信頼性や有効性にも疑問が残る場合が多くあります。ビッグデータが、膨大に集まれば、高性能AIであれば予測推定は可能であるという主張する人も時々います。しかし、もしAとB、Cが戦争を継続している時、あるタイミングで状況が変化して戦争継続が困難になった場合、有利不利・損得から簡単に裏切る結果となる事は歴史上良くある事です。人体内部でも個人差はありますが、この戦争や紛争に似た状況が発生していると言われています。体内での炎症反応が長期化すれば、免疫システムの後退リスクは増加して癌や感染症への対抗措置が大幅に機能低下する危険もあり得ます。その全ての要因が、分析・解析の俎上に並べる事が出来ている場合、問題は少ないのですが、良く分からない要因が背後に隠れてしまっている場合は、注意が必要ですしその解析には限界がある事を知るべきです。癌細胞が老化細胞を癌化させて細胞分裂を制御するテロメラ-ゼ/DNA複製酵素・細胞不死化酵素/1997年発見の再活性化により細胞分裂回数を延長させる事が研究により判明しました。テロメアTTAGGG/6塩基対は、個人差はありますが略1万塩基対・約1,700個のチェーンが、1回の細胞分裂により約50塩基対程度減少すると考察されています。癌細胞は、巧妙に免疫細胞の攻撃を回避して自分が正常細胞の様に振る舞うメカニズムは、更なる解析時間が必要でした。「免疫逃避機構」は、がん抗原減少・免疫抑制物質・免疫チェックポイント等による免疫細胞の攻撃を回避する仕組みや物質が俎上に乗らないと予測推定は極めて難しいものとなります。

➔ 専門家の継続研究により徐々にそのメカニズムガ解明されつつあります。2020年3月には、国立がん研究センターにより癌細胞の不死化のメカニズムの新しい機能スイッチONに関する解明が発表されています。 https://www.ncc.go.jp/jp/information/pr_release/2020/0325/index.html

更に、現在、老化のメカニズムや抗老化研究が先進国を中心にして精力的に進められています。ご存知の様に、癌の治療薬や治療方法は、以前と比較して大分進んではいますが、従来から5年以内に癌は恐れる病気では無くなるだろうと繰り返し言われて来ましたが、依然、日本では癌による死者数はNo.1です。癌を含めた疾患別死因の統計は、先進国の多くが癌による死者数(対10万人当たり)を減少させる事に成功していますが、日本では逆に増加傾向にあります。非常に残念な結果ですが、老化・認知症MCIの傾向も同様に加速しています。この統計は、単純にゲノムの問題や医療技術の差の問題というよりは、一見病気では無い人たちの食習慣・運動習慣・睡眠・ストレスを含めた生活習慣に問題があると考えるべきだと推測するに十分な根拠になるのではと考えています。

また、近年の体内の細胞レベルの研究からは、細胞間伝達物質と言われているエクソソームのやりとりは、細胞の癌化や心臓病、糖尿病、その他の疾患に強い影響を与えている事が示唆されています。例えば、エクソソームは癌の転移先の臓器を増殖しやすい環境に変えると考えられています。心臓病では、従来、心臓の細胞は殆ど細胞分裂をせずに再生機能も低いと考えられていましたが、エクソソームの米国での研究では、これが、心臓の再生や炎症抑制、心筋を太くする働きを活性化する可能性を見つけています。糖尿病の領域では、1型(先天性)・2型(後天性)の超尿病がインスリン分泌の問題がその1つである事が知られていましたが、東北大学の研究では、骨髄の細胞が出すエクソソームに含まれるRNAには、再生能の低いβ細胞を増やして、インスリン分泌や血糖値を改善する働きがある事が発見されています。 また、米国の専門家の間では、インスリン抵抗性の問題として、血糖値をUPさせる血糖を上げる作用に影響があるホルモンには成長ホルモン、副腎皮質ホルモン(コルチゾール・アルドステロン)、副腎髄質ホルモン(カテコールアミン)、甲状腺ホルモン、グルカゴン、ソマトスタチン等の異常分泌・制御不良を指摘する声もあります。これらが、エクソソーム研究が進められる事で、正常な状態に戻せる可能性を探る研究が進み始めています。(これらのホルモンは、必要以上にたくさん分泌されると血糖値を上昇させてしまって、正常範囲に血糖値を制御出来ない可能性が疑われています。)

健康維持の“酵素反応”は「体温・pH」と相関がある

ビッグデータは、その関連性がハッキリしない複数のデータに対してデータ規模(数量)と比較データの種類が増加するにつれてより詳細な因果関係やグループ or 見えない要因への考察が可能となります。 良く言われる例ですが、遺伝的疾患要因(ゲノム)は、いくつかの疾患との相関研究が進んでいますので、例えば、膵臓がんや乳癌等のリスクのある一卵性双生児兄弟or姉妹が、その生活習慣の違いにより実際に癌化する場合と癌化を抑制して発症しないケースが知られています。これについては、一卵性双生児の追跡調査研究やエピゲノムと呼ばれる体内のまた、免疫力(調子)を示す1つのバロメーターとして、体温があります。単純にビッグデータとしての視点で見た場合、2019年での日本人の平均体温は、36.14℃とあり通常はこれに対して自分の体温が高いor低いという比較をする事が多いと思いますが、67年前の日本人の平均体温は36.89℃という記録があります。同じ日本人ですが、体温の変化をどう捉えるべきなのか?については、単純にビッグデータの示す平均値や偏差値の比較では無く、他にも要因があるのでは?と科学的に考えた方が「健康」を考える上では安全だと思います。専門家が指摘していますが、体温が1℃違うと免疫力が~30%の差になると言われています。体温が1℃上昇すると、基礎代謝率は13%亢進し、エネルギー必要量と消費量が増加して、栄養や酸素を早く組織に運ぶ必要が生じる事から、自律神経は心拍数と呼吸数を増加させると考えられています。(+10拍/分間)

人間の体温の維持では、酵素反応を効率良く活性化させる36~37℃に調整されます。また、体内にある酵素は、その反応活性のpH値が種類により異なる事が知られています。その存在する場所によって、酵素活性がベストとなる様に体内で上手く調整されている事は驚きと言えます。

私達の多くは、生命維持についてはあまり気にしなくても高度に管理されている様に考えていますので、痛みや熱等の体調不良を意識する迄、殆ど気にする人はいないのが実態です。特に、加齢の様に徐々に長い時間を掛けてゆっくり体内のホルモンバランスや酵素活性が低下する場合は、「もう年だし仕方が無い」or「病院に行って薬でも貰えば直ぐに回復するだろうと」という考えで、痛みや熱が我慢できないレベルになる迄、病院や医者に相談する?大袈裟過ぎる反応だというのが殆どだと思います。勿論、高齢者であっても介護や治療を必要としない人達がいる事実も良く考える必要があります。(100歳以上の超高齢者でもその10~20%の人は、統計では介護や治療を必要としていません。)

「健康を科学する」という意味は、その個体差や生活環境の違いを前提にして、自分に最適な「健康」の実現を見える化を通して自然に実践する事です。多くの人が、気付かずに健康に良い事と信じている事を間違って実践してしまっている人が多くいるのも現実です。ビッグデータ解析や予測は、確かに強力で有効な手段ですが、見えない要因や「何故」を考えて利用しないと間違った実践をして後悔する事になります。勿論、間違うという事も含めて、それぞれ個人の判断や実践結果であり、他人から色々と言われる筋合いのものではありませんが、知らない事で痛みや熱に悩まされながら大切な人生を過ごす事は避けた方が良いと考えます。例えば、オートファジーが重要だと聞いて、1食/日を急に始める人が多くいます。短期的には、効果があるかも知れませんが中長期的には「健康に良い」と言えるのでしょうか?カロリー制限は、代謝を良くしてアカゲザルの実験では部分的に若返り効果があったとする報告もありますが、追試した研究機関によればプラスとマイナスがあるとされています。実際、これを提唱した米国のRoy Lee Walford M.D. の"Biosphere 2"と呼ばれる1.8千億円(15億ドル)の施設での実験が良く知られています。過食群に比較して、カロリー制限群は「健康」には有利という結論の様ですが、ある程度、良くコントロールされた栄養状態の良い食事(バランス)の方が、「健康長寿」には良いという結論の様です。後日談になりますが、ロイ博士は、79歳呼吸不全(筋萎縮性側索硬化症/ALSによる)で他界されています。人間は、120歳迄生存可能と信じて、カロリー制限の可能性を強く信じていました。

https://www.mnc.toho-u.ac.jp/v-lab/aging/doc2/doc2-01-2.html

勿論、ストレスを避ける生活や質の良い睡眠、適度な運動や入浴・サウナをプラスして良い食習慣を実践し健康的な生活をしていれば、申し分無く「健康長寿」が得られると期待されています。実際、100歳を超えた長寿者で、1食/日を実践している人を知りません。栄養面から見ても蛋白質・脂質・糖質やミネラル・ビタミン、抗酸化物質とか食物繊維・発酵食品(腸内環境を改善)を1食で摂取しようとすると恐らく高価なサプリメント類を多用しないと相当無理があると想像します。但し、プチ断食や断食道場へ時々活用するやり方は「健康効果」が期待出来ると考えられます。(1~2日/週 or 1~2週間)

理想的科学的な免疫システムの活性化が大切

イスラム教のラマダン(断食)は、16億人のイスラム教徒の間では神聖な義務とされていて、その目的は、富める者も貧しい人も等しく空腹や渇きの辛さを味わうことで、恵まれない人々を思いやり、改めて平安の有難さに感謝し、より自身を清めようとする心を養うものとされています。また、1ヶ月間、何も食べないのでは?誤解される人もいるかも知れませんが、実際は日の出~日没の時間帯限定の断食です。但し、信仰心のある人達は、夜も粗食で済ませる人も多いと想像します。夕食に大量に食事をする場合、体内に産生されたATPを細胞や臓器の修復するエネルギーに回す余力が減り、多くが消化運動に使ってしまいますから「健康」としてはマイナスになります。(以下は、ラマダンのWEB情報です。)

https://spaceshipearth.jp/ramadan/

細菌やウィルスが体内に侵入したり異常に増殖したりすると、アレルギー反応や炎症反応が体内で起こります。通常は、マクロファージが異物を攻撃して撃退するのですが、手強い相手であれば、体内の免疫システムを総動員させて全力でこれを破壊する様に対抗します。マクロファージは、新型コロナ感染拡大でTVやメディアでも取り上げられていたサイトカイン(インターロイキン、インターフェロン、腫瘍壊死因子TNF、他)を放出して対抗します。熱が出る1つの理由は、インターフェロン等の活性化を最大限行いフル稼働して体を守ろうとするからです。ある程度体温UPは必要ですが、脳の細胞含めて42℃を超えると蛋白質の変性の問題に直面して、危険な状態になります。その為、あるレベルからは体温上昇を抑制する解熱剤とかが必要になります。多くの場合、この状態であれば、病院や医師が看てくれる状態なのでその指示に従えば安心ですが、誰も頼れる人がいない状況ではある程度の知識を持ち活用した方が、リスクを低下させて生存確率を上げます。

但し、2019年の東北大学の研究チームが、インフルエンザウイルス感染時の解熱の必要性に関するレポートを発表していますので、大変参考になると思います。3日程度であれば40℃の高熱でもインフルエンザ感染した場合の細胞減少はあまり多く無いのですが(感染しない場合の細胞の減少は殆ど無い)、5日間40℃の高熱が続くとその被害は、感染しているor感染していないに拘わらず、無視できない程大きく細胞数の低下が起こったという報告です。やはり、解熱は、あるタイミングでは確実に必要になるとの結論の様です。

免疫システムの1つの指標「体温」

体温は、多くの人の健康状態や免疫システムと高い相関のあるパラメータの1つとして知られています。勿論、個体差がありますので、絶対にこれだという話では無いのですが、一般論として36.5℃が1つの健康指標として知られています。しかし、ビッグデータの利用を考えた場合、その母集団の状態を考察して解析を行わないと違った結論になります。例えば、日本人の平均体温は、67年前(1957年)では36.5℃でしたが、女性の2018年平均体温が36℃以下の人が38%もいるという統計データがあります。免疫システムとしては、36℃以下という状況は非常に不利な状況です。上図に示した様に、36.5℃以下の女性は、99%です。ビッグデータとして、自分は36℃であり平均的だと考えるのは、必ずしも適切な分析とは言えません。(母集団全体が、あまり健康で無い平均と比較する場合は危険。)
体内での健康を維持したり、生命を維持したりする為の酵素反応は、体温やpH値によりその酵素活性・反応速度が大きく左右されます。理科や生物の教科書でも良く取り上げられるトピックスですが、酵素反応を最適に活性化するのは、37℃前後と言う事が知られています。蛋白質から構成される生物の多くが、42~43℃を超えて長くは生き残れませんので、合理的な特性ではあります。

実際、36.5℃より低い35.X℃の体温は、癌化リスクをUPする可能性があるという専門家もいます。 私達の免疫システムを最高の状態に維持しようとする場合、36.5~37℃あたりの体温維持を1つの理想値として調整すると良いと思います。結果的に体内の血液状態や細胞内のミトコンドリア活性(量)をUPさせる必要がありますから、1つの目標値として十分に参考or健康指標になるかと思います。
詳細については、個別に「健康習慣」を良くして「健康阻害要因」を抑制・排除する生活習慣が大切になりますが、AxHELP「健康サービス」を是非利用して下さい。無駄に老化を加速させないor意味の無い疾患リスクUPを避けて、笑顔で安心な生活QoLを目指して下さい。

体内では、5千種類以上の酵素反応が起こっていると言われています。また、酵素も約5千種類あると考えられていて、体内でつくられる酵素「体内酵素」と、体外から取り込む酵素「体外酵素」の2種類に大別されます。体内酵素は更に、働きに応じて「消化酵素」と「代謝酵素」に分けられます。
体外酵素は、人以外の生物に存在する酵素であり、例えば、体外酵素として免疫に関係する腸管内に生息する常在細菌が生み出す酵素も含まれます。一方、生の食べ物に含まれる酵素は「食物酵素」と呼ばれています。食物酵素の1つは、良く知られている「消化酵素」です。生のパイナップルやキウイフルーツを摩り下ろして(缶詰では無い)、肉に揉み込むとプロテアーゼという酵素の働きで肉が柔らかくなる事を体験していると思います。プロテアーゼは、他にパパイヤ・生姜・イチジクにも豊富に含まれています。
ご存知の様に、必ず「生の果実」を使用しないと酵素反応が起こりません。これは、加熱後の果実の酵素は破壊されてその活性を失い、本来果実に含まれるプロテアーゼの働きが阻害されるからです。肉を柔らかくするのは、タンパク質をより小さなポリペプチドや単一のアミノ酸への分解を触媒する加水分解酵素プロテアーゼの働きによるものだからです。プロテアーゼは、セリンプロテアーゼ・システインプロテーゼ・スレオニンプロテアーゼ・アスバラギン酸プロテアーゼ・グルタミン酸プロテアーゼ・金属プロテアーゼ・アスパラギンペプチドリアーゼ(2011年報告)の7種類が知られています。
これらは、pH値によりその活性が変化する事から酸性プロテアーゼ・中性プロテアーゼ・アルカリ性プロテアーゼの3種類に分類される場合もあります。プロテアーゼの研究は、以下は、pH値により活性が変わる酵素①~③を示しています。
酵素の利用は、紀元前3千年頃には利用の歴史があるとされていますが、現在の「酵素」発見の歴史は、19世紀に入ってからであり、1833年に麦芽の抽出液から澱粉を糖化する物質が抽出され、ジアスターゼと命名されています。その後、インベルターゼ、トリプシン、ラッカーゼ、フィターゼなどが発見されて行きました。1926年には、ウレアーゼが結晶化されて、その後次第に酵素が蛋白質である事が認識される様になります。豚のすい臓由来のプロテアーゼを規格化生産された物は、1907年に販売が開始され、瞬く間に皮革産業で使用されて酵素産業として広く認識される様になります。現在は、疾患リスクと酵素活性・阻害剤の研究が活発に実施されて年間8千件を超える発表があると言われています。

酵素反応は、体内の肝臓等の臓器では、多種多数高度に利用されています。微量であっても、ミネラルやビタミン類はその重要な酵素反応を支えています。もし、酵素反応を利用せずに、肝臓内部での化学反応を触媒ベースにした工業化学的な装置で実現すると5階建てのビルが必要になるだろうという専門家もいる程です。腎臓の機能をカバーする人工透析装置も高性能化・コンパクト化が進んでいますが、やはり腎臓であれば血液・体液量やイオンバランス・血圧調整・骨密度などへの対応が可能ですが、人工透析はフィルター(濾過)性能に注力されて開発が進んでいますので、心臓病や合併症リスクは医師の治療やアドバイスが必須になります。
細菌やウィルスに感染すると体内では免疫反応が起こります。その免疫反応の大小の違いはありますが、サイトカインと呼ばれる物質が循環します。サイトカインは、炎症の重要な調節因子で細胞から分泌される低分子のタンパク質の総称です。サイトカインは、侵入した病原体に応答して産生され、免疫細胞を刺激、動員、および増殖させて、免疫システムを活性化します。サイトカインには、インターロイキン(IL)、ケモカイン、インターフェロン、および腫瘍壊死因子(TNF)などがありますが、深部体温が上昇するとその数が増加する事が知られています。下図は、インターフェロンINF-γ数と深部体温の関係を示しています。その産生源は、T細胞・NK細胞になります。抗ウィルス、マクロファージ活性化により、好中球と単球の機能、細胞でのMHC-Iと-IIの発現を増加させます。MHCは、免疫反応に関係する自己と非自己を識別する糖たんぱく質です。私たちの細胞の表面には、MHCという糖タンパク質がたくさん(細胞1つあたり10万の単位)発現しています。ヒトにおけるMHCのことをHLA(Human Leukocyte Antigen; ヒト白血球抗原)といいます。HLAを規定している遺伝子領域は第6番染色体短腕にあり、タンパク質の構造と機能の違いから、クラスI(HLA-A、-B、-C など)、クラスII(HLA-DR、-DQ、-DP など)、クラスIII の遺伝子領域に分類されています。HLAハプロタイプとしても知られていますが、遺伝子治療や臓器移植その他で、適合性をチェックする目的で利用されます。)

ビッグデータ利用の他の注意点は、1つの特徴や傾向が、他のパラメータ(要因)との相関が予想されていても、見えない隠れたパラメータが大きな影響しているケースです。その場合は、結果的に相関係数はやや不安定になり低い値となります。逆に言えば、いくつかのデータ群が高相関を示しているのに、他のデータとの相関が低い場合は、何か隠れた支配的なパラメータが隠れている可能性があります。例えば、生活習慣の違いやゲノム・エピゲノム、細胞間の相互作用を示すエクソソーム(miRNA)等は、今迄あまり注目されてこなかったパラメータとして考慮される様になると想像されます。

AIによる解析する場合に取り上げられる話題として「ブラックスワン」があります。(オーストラリアで黒色の白鳥が見つかる迄、白鳥は「白い」ものだと皆が信じていた問題。ナタリー・ポートマン出演の映画とは無関係)自然科学や応用工学の分野でも、滅多に怒らない現象を例外として排除するのでは無く、その何故?を解析した新しい事実から、ノーベル賞クラスの発明や発見が生まれる話は良くあります。そういう意味で、盲目的に「AI」を信奉するのでは無く、上手に利用する事が大切だと思います。 以下の2つの図は、実データ(左図)とそれをベースに分散・分布と相関から1桁データ量を増加させたレプリカデータ(右図)です。時間とコストを掛けて得た実データと比較しても良い一致を示します。 但し、100万人に1人という希少データを生成可能という意味ではありません。その母集団の示している統計的な特徴量を維持しながら極めて似た傾向のデータ拡大が可能という意味です。

日本では、新型コロナ感染拡大のパンデミックステージに入る前迄は、平均寿命を毎年更新して世界と比較してNo.1を更新していました。但し、2021年・2022年と日本の平均寿命は減少傾向を示しています。都道府県レベルでの統計では、2023年に関しても悪化傾向が懸念される状況にあります。 1950~2019~2022年の世界レベルの統計データでは、新型コロナパンデミックの影響もあり、一部の地域を除いて世界的には悪化傾向を示している様です。日本では、2021~2022年、2023年(予測)と平均寿命の減少が続く傾向を示しています。勿論、V字回復の可能性もありますが、平均寿命の減速要因が科学的に分かれば、今後、この傾向が継続するのか?回復を示すのか?は推定が可能となります。