banner
ホームページ / ブログ / HighAltitudeOmicsDB、高高度の統合リソース
ブログ

HighAltitudeOmicsDB、高高度の統合リソース

Apr 03, 2023Apr 03, 2023

Scientific Reports volume 13、記事番号: 9307 (2023) この記事を引用

メトリクスの詳細

世界中の何百万人もの人々が、高地で遭遇する低酸素環境を訪れ、生活し、働いています。このストレスに対する生体分子の反応を理解することが重要です。 これは、高地疾患の軽減戦略を立てるのに役立ちます。 100年以上にわたる多くの研究にもかかわらず、低酸素への順応を制御する複雑なメカニズムは依然としてほとんど知られていない。 HA ストレスの潜在的な診断、治療、予測マーカーを特定するには、これらの研究を包括的に比較および分析することが重要です。 この目標に向けて、HighAltitudeOmicsDB は、さまざまな HA 状態、そのタンパク質間相互作用 (PPI) および遺伝子に関連することが実験的に検証されているさまざまな遺伝子/タンパク質の包括的で精選された、ユーザーフレンドリーで詳細な編集を提供するユニークなリソースです。オントロジー (GO) の意味上の類似性。 HighAltitudeOmicsDB は、データベース エントリごとに、制御レベル (上方制御/下方制御)、倍率変化、研究対照群、曝露期間と標高、発現組織、感染源生物、低酸素レベル、実験的検証方法、場所を追加で保存します。データベースは、疾患と薬物の関連性、組織特異的な発現レベル、GO および KEGG 経路の関連性に関する情報も照合します。 Web リソースは、インタラクティブな PPI ネットワークとインタラクター間の GO セマンティック類似性マトリックスを提供する独自のサーバー プラットフォームです。これらの独自の機能は、疾患の病理に対する機構的な洞察を提供するのに役立ちます。 したがって、HighAltitudeOmicsDB は、この分野に取り組む研究者にとって、HA 関連遺伝子/タンパク質、その PPI ネットワーク、GO 意味論的類似性を探索、取得、比較、分析するためのユニークなプラットフォームです。 データベースは http://www.altitudeomicsdb.in で入手できます。

世界の人口の大部分は高地 (HA) 地域に住んでおり、多くの人がトレッキング、登山、その他のアドベンチャー スポーツなどのアウトドア アクティビティのために 2500 メートル以上の山を訪れます。 高高度への急速な上昇は、気圧の瞬間的な低下につながります。 酸素濃度は同じままですが、呼吸あたりの酸素分子の数は減少します。 たとえば、高度 3600 m では、気圧が 483 mmHg に低下し、呼吸に利用できる酸素分子は 40% 未満になります。活動に必要な酸素の量は同じであるため、体は酸素の減少または低圧低酸素に適応する必要があります1 。 低地住民の中には、順応として知られるプロセスを通じて高地での酸素利用可能量の減少に適応する人もいますが、急性高山病 (AMS)、高地脳浮腫 (HACE)、高地肺水腫 (HAPE) などのさまざまな疾患に苦しむ人もいます。など2、3。 したがって、これらの生理学的変化の初期兆候を特定するための研究が勢いを増しています。 最近の低地着陸者のタンパク質プロファイルと高地での誘導との比較により、HA 順応中に血清タンパク質であるイリシン、ミオスタチン、急性前駆体タンパク質(APP)、アポリポタンパク質 A1 などの発現が異なるタンパク質が同定されました4。 これらのタンパク質は、高高度でのエネルギー関連プロセス、骨格筋再生、炎症反応、およびその他の特徴的な分子反応に関連しています5,6。 今後、これらのタンパク質は、高地での個体の早期順応を予測するためのバイオマーカーとして提案されています。 ペプチドプロファイリングを使用した低地着陸者および在来サンプル中の新規タンパク質バイオマーカーの探索は、潜在的な診断マーカーまたは治療マーカーを同定するための重要な方法となっています 3,6。 順応プロセスで重要な役割を果たす差次的に発現するタンパク質の同定は、HA での順応の原因となるメカニズムを明らかにするのに役立ちました。ゲノムワイドな研究により、HAPE7 中の血管恒常性を予測する可能性のある血漿タンパク質が明らかになりました。 同様に、トランスクリプトーム研究では、VIM、CORO1A、CD37、STMN1 などの低気圧低酸素曝露の初期段階に関与する複数の経路とタンパク質の調節が示されました。8 高地にさらされた人間や動物の「オミクス」プロファイルを報告した膨大な文献が存在しますが、 本当の課題は、これらすべての研究を統合して、高地の低酸素環境における細胞、組織、器官、さらには生物全体の機能的適応に関与する継続的に進化するメカニズムを総合的に理解することである。 そこで私たちは、この散在するデータをすべて収集、整理、分析、視覚化する HighAltitudeOmicsDB を開発しました。 データベースには現在、HA ストレスによって調節されることが実験的に証明されている、査読済みの出版物から手動で厳選された約 1300 のタンパク質関連が含まれています。 データベースには、各タンパク質と HA ストレスとの関連性が、制御レベル (上方制御/下方制御)、倍率変化、研究対照群、曝露期間と標高、発現組織、ソース生物、発現レベルなどの観点から保存されています。低酸素症、実験的検証方法、研究の場所/国、民族性、地理的位置など。データベースは、タンパク質が HA バイオマーカーとして関連することが実験的に証明されているかどうかも提供し、対応する出版物へのリンクも提供します。 このデータベースは、タンパク質の公式シンボル、タンパク質の別名、染色体の位置、長さ、Uniprot ID、酵素委員会 (EC) 番号、タンパク質ファミリー情報 (Pfam) ID、タンパク質データバンク (PDB) ID、統合タンパク質シグネチャー データベース (InterPro) ID、一塩基多型データベース (dbSNP) ID。 このデータベースには、GO アノテーションや京都遺伝子ゲノム百科事典 (KEGG) 経路関連などのタンパク質の機能情報も表示されます。 他の病気や薬物との関連性。 このデータベースは、各タンパク質とその上位 50 位の相互作用パートナーとのタンパク質間ネットワーク相互作用も提供します。 ネットワークはWebサーバー上でインタラクティブに視覚化できます。 さらに、HighAltitudeOmicsDB は、これら 50 のインタラクターとの遺伝子の意味的類似性を計算して、機能的に関連するタンパク質を特定します。 データベースにはさらに、遺伝子と相互作用する転写因子とその制御タイプ (抑制、活性化、遠位、近位など) が保存されます。 さらに、遺伝子と相互作用する miRNA もリストされています。 したがって、HighAltitudeOmicsDB は、HA ストレスに関連する遺伝子/タンパク質、その PPI ネットワーク、意味的類似性、転写因子や miRNA による制御を探索、検索、比較、評価するためのユニークな統合プラットフォームです。 これは、HA に順応するために存在するタンパク質間の根底にあるクロストークを明らかにするのに役立ち、また、これらの複雑な分子応答の機構に関する洞察も提供します。 したがって、これは、高地障害の新しい診断、予後、および治療戦略の開発にさらに役立つ可能性がある、新規で強力な分子バイオマーカー候補を特定するのに役立ちます。

「高地」、「タンパク質」、「遺伝子」、「オミクス」、「低気圧-低酸素」、「酸素欠乏」などのさまざまなキーワードの組み合わせが、PubMed や Google 検索エンジンからの大規模な文献マイニングに使用されました9。 出版物は手作業で精査され、発現の異なる遺伝子/タンパク質が特定されました。 冗長性と重複性を除去した後、HA で差次的発現 (DE) することが判明したタンパク質の包括的なリストがこれらの出版物から厳選されました。 各 DE タンパク質について、次のような関連情報も取得されました。 「タンパク質の名前」、「タンパク質の公式シンボル」、「別名」、相同な「Human Entrez ID」、「ソース生物」、「発現組織」、「低酸素レベル」、「高度」、「実験期間」 、「規制レベル」、「倍率変化」、「実験の詳細」、「地理的位置」、「民族」、「対照群」、「バイオマーカーとして関連付けられている」。 ソース生物がヒト以外である研究では、Uniprot データベースに対してタンパク質 BLAST を使用して、相同なヒト遺伝子/タンパク質が同定されました。 配列類似性が最も高く、E スコアが最小の相同ヒトタンパク質が選択されました。 最小閾値は、80% を超えるペアごとの配列類似性とみなされました。 この方法では、異なる実験生物 (マウス/ラット/ヤク/鳥/ヒキガエル/羊) で行われた実験であっても、人間による等価性/翻訳が容易になります。コレクションは JavaScript Object Notation (JSON) ファイル形式で保存され、MongoDB10 に保存されました。 。

各タンパク質について、タンパク質の公式シンボル、タンパク質の別名、染色体の位置、長さ、Uniprot ID11、酵素委員会 (EC) 番号 12、タンパク質ファミリー情報 (Pfam) ID13、タンパク質データバンク (PDB) ID14、統合タンパク質シグネチャー データベース (InterPro) などの追加の詳細) Id15、一塩基多型データベース (dbSNP) Id16 は、他のデータベースとのクロスリンクを支援するために収集されました。 各タンパク質について、その GO 機能強化と経路アノテーションは、それぞれ Database for Annotation, Visualization and Integrated Discovery (DAVID) と KEGG マッパー ツールによって実行されました 17,18。

データベース内の各タンパク質について、その上位 50 位のタンパク質相互作用因子が、相互作用タンパク質検索ツール (STRING) ウェブサーバーによって特定されました19。 検索の厳密性は最高レベル (0.9) に維持され、フィルターは、クエリされたタンパク質の直接の相互作用物質として最大 50 個の関連タンパク質を許可するように配置されました。 STRING データベースは、染色体上の近傍、遺伝子融合、系統発生的共起、相同性、共発現、実験的に決定された相互作用、データベースの注釈付き自動テキストマイニングといった 7 つの情報源に基づいてタンパク質間相互作用ネットワークを構築します。 インタラクション ファイルは STRING データベースからダウンロードされ、JSON 形式で保存されました。

データベースをより有益なものにするために、他のいくつかの属性も追加されました。 タンパク質と病気の関連性は DisGeNET20 から抽出されました。 DGIdb 3.0 データベースからのタンパク質と薬物の関係21。 これらすべての属性も JSON ファイルに保存されました。

遺伝子オントロジー (GO) アノテーションに基づく遺伝子間の意味比較は、遺伝子間の機能的類似性を定量的に評価する革新的なアプローチです。 これらは、さまざまなバイオインフォマティクス分析で広く使用されています 22,23。意味的類似性スコアが高いほど、2 つの遺伝子/タンパク質が類似の分子機能を持っているか、共通の生物学的プロセスに関与している可能性が高くなります 22。 意味的類似性スコアが低い場合は、2 つの遺伝子が異なる分子機能を付与していることを示します。 意味的類似性を特定するために、HighAltitudeOmicsDB 内の各タンパク質とその上位 50 の直接相互作用タンパク質が GOSemSim R アルゴリズムに提出されました 23。GOSemSim は、GO 用語、GO 用語のセット、遺伝子産物、および遺伝子クラスター間の意味的類似性を計算するための R パッケージです 23 。 結果は 51 × 51 のマトリックスで表されました。 これらの行列ファイルもすべて JSON ファイル形式で保存されました。

構築されたすべての JSON ファイルは MongoDB データベース コレクションに転送され、pymongo を使用してサーバー localhost にアップロードされました。 サーバー クエリ コマンドは MongoDB コンパスで作成されました。 Vis.js ライブラリは、特にタンパク質間相互作用ネットワークを表示するために使用されました 24。 Human Entrez ID、Uniprot ID、タンパク質公式シンボル、EC 番号、PDB_ID、InterPro ID、Pfam ID、dbSNP ID、およびすべてのテーブルに存在する参照 PMID などの ID は、追加の詳細を提供するために対応するデータベースにハイパーリンクされています。 Web インターフェイスには、ユーザーが新しいデータを送信するためのデータ送信フォームを含む「お問い合わせ」ページもあります。 それは定期的に見直され、データベースに追加されます。

HighAltitudeOmicsDB は、事前の登録を必要としない、ユーザーフレンドリーで無料でアクセスできるリソースです。 これは、発現レベルが高地ストレスに関連することが実験的に検証されている遺伝子/タンパク質の包括的で冗長性のない手動で精選されたリソースです。 データベースは、「参照」および「検索」オプションを使用して調査できます。

「参照」オプションを使用すると、ユーザーはプルダウン メニューからデータベースから単一または複数の遺伝子/タンパク質を簡単に選択できます。 あるいは、ユーザーはタンパク質の公式シンボルを含むファイルをアップロードするか、タンパク質の公式シンボルを入力することもできます。 隣の「参照」ボタンをクリックすると、個々のタンパク質のページにハイパーリンクを張る表形式に接続します。 ユーザーリストにデータベースにないタンパク質シンボルが含まれている場合は、それを強調表示する別の表も提供されます (図 1)。

Web サーバーのホームページと参照オプション。

データベースの「検索」オプションでは、ユーザーの研究関心に基づいてデータベースを探索するための複数のオプションが提供されます。 染色体による検索では、任意のヒト染色体番号をクリックして、それぞれの染色体上にある HighAltitudeOmicsDB のタンパク質を特定することができます。 「実験期間」で検索すると、発現が時間/日/週/月/年単位で変化する遺伝子/タンパク質のリストを特定できます。 「発現組織」で検索すると、プルダウン メニューが開き、そこから目的の組織を選択できます (図 2)。 「民族」、「ソース生物」、「規制レベル」、「地理的位置」で検索すると、同様にプルダウン メニューが開き、ユーザーはそれぞれ民族、ソース生物、アップ/ダウンレギュレーション、場所を選択できます。そして、タンパク質のそれぞれの詳細情報ページにハイパーリンクされている遺伝子/タンパク質の表形式のリストを取得します (次のセクションで説明します)。

「検索」モジュールのスクリーンショット。

さらに、「バイオマーカーとして関連」オプションを選択すると、HA ストレスの分子バイオマーカーとして提案/検証されているタンパク質の表形式のリストが表示されます。 タンパク質のシンボルは、それぞれのタンパク質のページにハイパーリンクされており、そのページからタンパク質をバイオマーカーとして検証する PubMed へのリンクが提供されます。 さらに、高度に依存した方法で DE であるタンパク質を取得するために、ユーザー対話型スライダー (2200 ~ 9800 mt の範囲) が提供されます。 ユーザーはスライダー値を設定し、定義された高度範囲に関連付けられた遺伝子/タンパク質を取得できます。 これは、HA への曝露時間および規制レベル (上/下) の (AND/OR) オプションと組み合わされています。 したがって、ユーザーは、高度 2,200 ~ 4,500 メートルの範囲で日数で発現された上方制御/下方制御されたタンパク質などの組み合わせクエリを作成できる可能性があります。 これらのタンパク質のリストは、さらに分析するために Excel /PDF 形式でダウンロードできます。

ウェブサーバーを使用すると、特定の転写因子 (TF)、miRNA、疾患、薬物、GO または KEGG 経路に関連する HighAltitudeOmicsDB のタンパク質を探索することもできます (図 3)。

「検索モジュール」のスクリーンショット。

タンパク質およびその HA との関連の詳細は、6 つのセクションに分かれている詳細情報ページに記載されています (図 4)。

知識ベース

タンパク質情報の詳細ページ。

これは、タンパク質の公式シンボル、別名、染色体の位置、長さ、Uniprot ID、EC 番号、Pfam ID、PDB ID、InterPro ID、dbSNP ID などのタンパク質に関する一般情報を提供するデータベースの最初のセクションであり、相互リンクが可能です。追加のデータベースを簡単かつ迅速に作成できます。 Uniprot ID は Uniprot データベースにハイパーリンクされています。

インタラクションとセマンティクス

各タンパク質の上位 50 の直接タンパク質相互作用物質は、方法論セクションで説明されているカットオフを使用して STRING データベースから特定されます。 ネットワークは、翻訳、ズームイン、ズームアウト機能を備えたユーザー対話形式で表示されます。 ノードは色分けされています (黄色: 研究対象のタンパク質、青色: 上位 50 の相互作用因子)。 エッジも色分けされています (黄色: 研究対象のタンパク質とその 50 の直接相互作用因子間の相互作用、青色: 上位 50 の相互作用因子間の相互作用)。 ネットワークは、Cytoscape、Bina などのネットワーク視覚化ソフトウェアで簡単に視覚化できる .sif 形式で簡単にダウンロードできます。それらの間の相互作用のリストとそれらを組み合わせたスコアは、Excel/でダウンロードできる表形式で簡単に提供されます。 PDF形式。 この表には、目的のタンパク質を簡単に検索するための「検索」オプションも提供されています。

ペアワイズ GO 意味論的類似性スコアは、方法論のセクションで説明したように、研究対象のタンパク質とその相互作用する上位 50 タンパク質の間で計算されました。 結果は 51 × 51 のマトリックスとして視覚化されます。 GO 意味類似性スコア > 0.8 は、マトリックス内で赤色で強調表示されます。 上位 50 のインタラクターのいずれかのタンパク質が HighAltitudeOmicsDB の一部でもある場合、マトリックス内のタンパク質のシンボルは、データベース内のそれぞれの詳細なタンパク質情報ページにハイパーリンクされます。これは、HA に関連するタンパク質の機能ハブを特定するのに役立ちます。したがって、順応/適応の分子基盤を解明できる可能性があります。

高地との関連性

各タンパク質について、HA ストレスとの関連性が表形式でまとめられています。 詳細は、ヒトタンパク質のシンボル、ソース生物(研究が実施された生物)、発現組織、低酸素レベル、高度、実験期間、発現レベル、変化倍数、実験の詳細、地理的位置、民族性、対照群の発現、対照群の詳細および参考論文。対照群は研究計画に基づいて定義されます。たとえば、一部の研究では低地民を対照群としており、HA ネイティブまたは低地民で差次的に発現するタンパク質が同定されました。 -は。 他のいくつかの研究では、HA ネイティブは対照とみなされ、低地人では差次的に発現されるタンパク質が同定されました。 したがって、対照群は研究によって異なり、データベースに明確に記載されています。バイオマーカーとしてのタンパク質の関連性も編集されます。つまり、タンパク質がバイオマーカーであることが実験的に検証された場合、列のエントリは次のようになります。それ以外の場合は「はい」、それ以外の場合は「いいえ」です。 この関連性を証明する各出版物へのハイパーリンクも簡単に提供されます。 この形式では、さまざまな期間、組織、高度条件におけるタンパク質の発現変化を簡単に調査、比較、分析できます。

TFおよびmiRNAとの関連

転写因子と miRNA は、遺伝子の発現を微調整する 2 つの最も重要な転写および転写後制御分子です。 したがって、研究対象のタンパク質を制御することが知られている TF および miRNA のリストが表形式で表示されます。 TF 関連テーブルには、TF シンボル (Genecards データベースにハイパーリンクされている)、その Entrez ID、研究対象のタンパク質のシンボルと Entrez ID、関連の種類、この関連を確認した出版物へのリンク、および関連が抽出されたデータベースがリストされます。 表は Excel/CSV 形式でダウンロードでき、ユーザー定義のキーワードを使用して表を探索するための「検索」オプションが提供されます (図 5)。

タンパク質情報ページのスクリーンショット。

同様に、miRNA 遺伝子関連テーブルには、miRNA miRTarBase ID、miRNA、研究対象タンパク質のシンボルと Entrez ID、実験 (ルシフェラーゼ レポーター アッセイ/ウェスタン ブロット/PCR/免疫組織化学など)、サポート タイプ、およびそれぞれの出版物へのリンクがリストされています ( PubMed へのハイパーリンク) により、この関連性が確認されました。 表は Excel/CSV 形式でダウンロードできます。 このテーブルには、ユーザー定義のキーワードを使用してテーブルを探索するための「検索」オプションも提供されています。

遺伝子オントロジーと KEGG パスウェイのアノテーション

Gene Ontology の注釈は表形式で表示されます。 GO ID、GO Term、および GO Type がリストされます。 GO ID は、詳細な GO 注釈を提供する QuickGO にもハイパーリンクされています25。 KEGG 経路のアノテーションもコンパイルされ、KEGG ID および KEGG Term として表示されます。 KEGG ID は、それぞれの経路に関する追加の詳細を提供する KEGG データベースにハイパーリンクされています。

これらのテーブルはどちらも Excel/CSV 形式でダウンロードでき、キーワード検索用の「検索」オプションが組み込まれています。

タンパク質と他の病気や薬との関連性

このセクションでは、薬物と病気の関連性について詳しく説明します。 情報は、それぞれのカテゴリに属する​​テーブルの形式で表現されます (図 4)。 最初の表は、遺伝子ターゲットとそれに関連する薬剤に関する情報を示しています。 このタイプの情報は、ユーザーが遺伝子/タンパク質ベースの薬物ターゲティング実験をガイド/設計するのに役立ちます。 これら 2 つのテーブルには、長いテーブル全体でユーザー定義の用語を簡単に検索するのに役立つ「検索」オプションが装備されています。 表は Excel/PDF 形式でダウンロードすることもできます。

HighAltitudeOmicsDB には、高地で差次的に発現することが判明した 820 のタンパク質の約 1,300 の関連が含まれています。 データベースを詳細に検討すると、すべてのタンパク質が 25 の組織での実験研究から得られたことがわかります (図 6a)。 これらの組織は、7 つの動物種、つまりヒト、ヒツジ、ラット、マウス、ヤク、鳥、ヒキガエルに由来します (図 6b)。 ソース生物としてのヒトは、民族性、つまりアメリカ人、チベット人、漢民族、イタリア人、ネパール人、ラダック人、ドイツ人という観点からさらに特徴付けることができます。 曝露時間は感染源の微生物によって異なり、在来個体群の場合は 0.5 時間から 110 日の範囲です。

HighAltitudeOmicsDB 統計 (a) 発現組織ごとの高地タンパク質の分布。 (b) 異なる供給源生物で研究された高地タンパク質の分布。

データベースには、GO および KEGG パスウェイエンリッチメントという 2 種類の機能アノテーションが含まれています。 GO エンリッチメントでは、「代謝プロセス」(GO: 0,042,572)、「アウター ダイニン アーム アセンブリ」(GO: 0,036,158)、「活性酸素種への反応」(GO: 0,000,302) が生物学的プロセスの上位に表示されます (図 7a)。 「代謝プロセス」は、高地での適応メカニズムによる体重減少と深く関連しています26。 高地では、低気圧低酸素の誘発によりHIFタンパク質が活性化され、細胞代謝/エネルギーの変化を媒介する遺伝子をさらに制御し、エネルギー消費量の増加による体重減少につながります27。 2 番目の生物学的プロセス「アウター ダイニン アーム アセンブリ」は、軸索アセンブリのプロセスです。 低酸素による軸索様繊毛の長さと密度の増加は、細胞死に関連しています 28。 最後に、「活性酸素種に対する反応」は細胞の酸化還元状態を反映しており、低圧低酸素による酸化還元状態の乱れは酸化ストレスや DNA 損傷を引き起こす可能性があります 3。 同様に、「フルクトース二リン酸アルドラーゼ活性」、「オキシドレダクターゼ活性」、「対のドナーに作用する」、「分子状酸素の取り込みまたは還元」、「オキシドレダクターゼ活性」、「アクセプターとしての過酸化物に作用する」、「電子伝達活性」などの用語」および「ATP結合」などが、データベースに存在するタンパク質の上位の分子機能であることがわかります(図7b)。 すべての分子機能は、酸化的リン酸化 (好気呼吸) に関連する直接的なステップまたはフィードバック機構です。 最近の臨床研究では、高地住民の腓腹筋組織にはミトコンドリアの割合が高く、これがエネルギー消費の高い環境への適応に役立つことが明らかになりました29。 「COP9シグナロソーム」と「アクトミオシン」は、データベースに存在する示差的に発現されたタンパク質セットで最も豊富に見られる2つの細胞成分用語です(図7c)。 COP9 シグナロソームは、低圧低酸素状態中に調節される pVHL、HIF-1α、およびその他の酸素応答性転写因子の発現を制御するユビキチン プロテアソーム分解複合体の一部です 30。 一方、アクトミオシンは、骨格筋などのさまざまな筋肉組織に存在するアクチン-ミオシン繊維複合体の細胞骨格です。 成体動物と人間の両方の筋線維タイプの組成は、高地に慢性的に曝露されると著しく変化します。

差次的に発現された高地タンパク質の機能的特徴付け (a) GO: 生物学的プロセス。 (b) GO: 分子機能 (c) GO: 細胞コンパートメントおよび (d) KEGG 経路の濃縮。

KEGG 経路の濃縮は、差次的に発現された HA タンパク質セットの中で最も濃縮された経路として「hsa00910: 窒素代謝」を示します (図 7d)。 窒素代謝は窒素酸化物生成のプロセスであり、亜硝酸、亜硝酸塩、硝酸塩などのこれらの酸化物は高地適応反応において重要な役割を果たすことがわかっています 31。 全体的な機能的アノテーションにより、データベースに存在するタンパク質と低圧低酸素ストレス応答との関連が明らかになり、データベースの包括性と特異性が裏付けられました。

高地上昇中、身体は低酸素症、低酸素血症、寒冷ストレスなどの極度の環境ストレスにさらされ、HA ストレスへの順応のために身体に多くの生理学的変化が生じます。 アンバランスな生理学的変化は、高地肺水腫 (HAPE)、高地脳浮腫 (HACE)、心血管障害 (CVD)、低体温症、筋萎縮、生命を脅かす可能性のあるさまざまな種類の代謝障害などの異常や病気を引き起こす可能性があります。 診断、予後、または治療の標的を特定するには、HA ストレスで調節されるさまざまな生体分子を総合的に研究する必要があります。 この目標に向けて、HighAltitudeOmicsDB は、高地条件に関連する遺伝子/タンパク質発現研究の包括的なすぐに使える参照リソースを提供します。 これには、高地関連の病気だけでなく、寒さストレスなどの同様の極端な条件にも対応するメタアナリシスのための約 1,300 のタンパク質関連情報が含まれています。 この検索は、ユーザーが一意の特徴と特徴の組み合わせの両方に基づいてデータをフィルターするのに役立ちます。 ユーザーは、高地に直接または間接的に関連付けられるフィーチャを選択できます。 組み合わせ検索は、特定のデータセットを抽出し、データの確率性を軽減するのに役立ちます。 これらすべての機能により、包括的な系統的レビューとメタ分析の可能性が高まります。 Web リソースは、HA 固有のタンパク質リポジトリであるだけではありません。 ゲノム/トランスクリプトーム/プロテオミクス データの比較および分析に役立つ独自の分析を実行できます。 このデータベースは、各タンパク質とその上位 50 位の相互作用パートナーとの PPI ネットワーク相互作用を提供します。 これらの PPI ネットワークは、HA 状態における異常の機能メカニズムを解明するのに役立つことがわかっています 32、33、34。 HighAltitudeOmicsDB は、遺伝子意味論的類似性マトリックス分析を通じてバイオマーカー発見の同定を加速することができます。 文献報告では、意味的類似性が、特に高地におけるバイオマーカー同定のための重要なツールであることが証明されています 35。

HighAltitudeOmicsDB は、HA ストレスに関連する遺伝子/タンパク質の知識を取得して整理する、インタラクティブなリソースおよびサーバー プラットフォームです。 さまざまな HA 関連の研究の包括的なビューを提供します。 PPI ネットワークとデータベース内の遺伝子/タンパク質に関連する意味論的な類似性の注釈と視覚化を提供します。 HighAltitudeOmicsDB は、テキスト マイニングと広範な文献調査を使用して取得された、発現差のある HA 遺伝子/タンパク質の包括的で手動でキュレーションされたリソースの最初のリポジトリです。 この情報により、ユーザーはデータベース内のさまざまなクエリ フィルター、つまり発現レベルに基づいて生体分子を閲覧できるようになります。 実験の期間。 標高と発生源の生物。 HighAltitudeOmicsDB には、TF および miRNA の制御、タンパク質と疾患の関連、タンパク質と薬物の関連などのタンパク質関連情報も含まれています。 したがって、HighAltitudeOmicsDB の情報ベースは非常に大きく、検証のための指示された実験を設計するためにこの情報を利用することが容易になります。 また、HighAltitudeOmicsDB は、データベース内の各タンパク質の PPI を識別し、それらの間の GO 意味論的類似性を計算します。この独自の機能は、HA ストレスに関連する相互作用タンパク質の特定のハブを特定するのに役立ちます。PPI ネットワークと類似性の分析により、ユーザーは、分析中にメカニズムの洞察を推測できるようになります。 HAストレス。 ウェブサーバーは、タンパク質の機能相関も提供します。 機能的相関には、GO 濃縮と KEGG 経路濃縮の両方が含まれます。 タンパク質関連データは、さらなる分析のためにデータベースから Excel/PDF 形式でダウンロードできます。

データベース内のデータ (テーブルとして表される) は、Web サーバー上に Excel/CSV 形式で簡単にダウンロードできます。 現在の研究中に使用および/または分析されたさらなるデータセットは、合理的な要求に応じて責任著者から入手できます。

Simonson、TS 高度適応: さまざまなレンズを通して垣間見ることができます。 ハイアルト。 医学。 バイオル。 16(2)、125–137 (2015)。

論文 CAS PubMed PubMed Central Google Scholar

Basnyat, B. & Murdoch, DR 高高地病。 ランセット 361(9373)、1967 ~ 1974 年 (2003)。

論文 PubMed Google Scholar

アーマド、Y.ら。 低気圧低酸素症への適応におけるヒト血漿プロテオームの変化についての洞察。 PLoS ONE 8(7)、e67548 (2013)。

論文 CAS PubMed PubMed Central Google Scholar

Wang, C. et al. 急性高山病の初期診断における急性期タンパク質と炎症性サイトカインの探索。 ハイアルト。 医学。 バイオル。 19(2)、170–177 (2018)。

論文 CAS PubMed Google Scholar

Sliwicka、E. et al. 2週間の高地登山後の血清イリシンおよびミオスタチンレベル。 PLoS ONE 12(7)、e0181259 (2017)。

記事 PubMed PubMed Central Google Scholar

アーマド、Y.ら。 高地肺水腫のバイオマーカーとしてのハプトグロビンおよびアポリポタンパク質 AI の同定。 機能統合。 ジェノム。 11(3)、407–417 (2011)。

記事 CAS Google Scholar

Sharma, M.、Singh, SB および Sarkar, S. のゲノムワイド発現解析は、高地肺水腫中の血管恒常性の混乱を示唆しています。 PLoS ONE 9(1)、e85902 (2014)。

記事 PubMed PubMed Central Google Scholar

ガウル、P.ら。 時間的トランスクリプトーム解析は、高地暴露の初期段階での細胞間相互作用に関与する複数の経路と遺伝子ネットワークの調節を示唆しています。 PLoS ONE 15(9)、e0238117 (2020)。

論文 CAS PubMed PubMed Central Google Scholar

Fiorini, N.、Lipman, DJ、Lu, Z. PubMed 2.0 に向けて。 Elife 6、e28801 (2017)。

記事 PubMed PubMed Central Google Scholar

Fejes, AP、Jones, MJ & Kobor, MS DaVIE: エピジェネティック データの視覚化と統合のためのデータベース。 フロントジュネ。 5、325(2014)。

記事 PubMed PubMed Central Google Scholar

Pundir, S. et al. UniProt ツール。 カー。 プロトック。 バイオインフォーム。 53、1 29 1-1 29 15 (2016)。

記事 Google Scholar

Bairoch, A. 2000 年の ENZYME データベース。Nucleic Acids Res. 28(1)、304–305 (2000)。

論文 CAS PubMed PubMed Central Google Scholar

フィン、R.D.ら Pfam: タンパク質ファミリーのデータベース。 Nucleic Acids Res 42 (データベース問題)、D222–D230 (2014)。

論文 CAS PubMed Google Scholar

バーマン、HMら。 プロテインデータバンク。 核酸研究 28(1)、235–242 (2000)。

論文 CAS PubMed PubMed Central Google Scholar

ハンター、S.ら。 InterPro: 統合されたタンパク質シグネチャ データベース。 Nucleic Acids Res 37 (データベース問題)、D211–D215 (2009)。

論文 CAS PubMed Google Scholar

スミギエルスキー、EM 他。 dbSNP: 一塩基多型のデータベース。 核酸研究 28(1)、352–355 (2000)。

論文 CAS PubMed PubMed Central Google Scholar

デニス、G. ジュニアら。 DAVID: 注釈、視覚化、および統合された検出のためのデータベース。 ゲノム バイオ 4(5)、P3 (2003)。

論文 PubMed Google Scholar

金久 正 他 KEGG: ゲノム、経路、病気、薬物に関する新しい視点。 核酸研究 45(D1)、D353–D361 (2017)。

論文 CAS PubMed Google Scholar

フォン・メーリング、C.ら。 STRING: タンパク質間の予測された機能的関連のデータベース。 核酸研究所 31(1)、258–261 (2003)。

記事 Google Scholar

ピネロ、J. et al. DisGeNET: ヒトの疾患関連遺伝子とバリアントに関する情報を統合する包括的なプラットフォーム。 核酸研究 45(D1)、D833–D839 (2017)。

論文 CAS PubMed Google Scholar

コット、KC et al. DGIdb 3.0: 薬物遺伝子相互作用データベースの再設計と拡張。 核酸研究 46(D1)、D1068–D1073 (2018)。

論文 CAS PubMed Google Scholar

Pesquita, C. 遺伝子オントロジーにおける意味的類似性。 方法 Mol. バイオル。 1446、161–173 (2017)。

論文 CAS PubMed Google Scholar

Yu、G.ら。 GOSemSim: GO 用語と遺伝子産物間の意味的類似性を測定するための R パッケージ。 バイオインフォマティクス 26(7)、976–978 (2010)。

論文 CAS PubMed Google Scholar

ローゼンタール、SB et al. Jupyter ノートブックでの対話型ネットワーク視覚化: visJS2jupyter。 バイオインフォマティクス 34(1)、126–128 (2018)。

論文 MathSciNet CAS PubMed Google Scholar

ビンズ、D. et al. QuickGO: 遺伝子オントロジー検索のための Web ベースのツール。 バイオインフォマティクス 25(22)、3045–3046 (2009)。

論文 CAS PubMed PubMed Central Google Scholar

ムーア、LG 高地適応の測定。 J.Appl. 生理。 (1985) 123(5)、1371–1385 (2017)。

論文 CAS PubMed Google Scholar

Palmer, BF & Clegg, DJ 減量方法としての高地への上昇: 低酸素誘導因子活性化の良い点と悪い点。 肥満 (シルバー スプリング) 22(2)、311–317 (2014)。

論文 PubMed Google Scholar

ブラウン、JMら。 低酸素は、鞭毛内輸送サブユニット遺伝子を欠くテトラヒメナの​​サプレッサーにおける繊毛の集合を調節する。 モル。 バイオル。 セル 14(8)、3192–3207 (2003)。

論文 CAS PubMed PubMed Central Google Scholar

Scott、GR、Guo、KH、Dawson、ニュージャージー州 高地シカマウスの有酸素運動能力の適応変動のミトコンドリア基盤。 統合します。 コンプ。 バイオル。 58(3)、506–518 (2018)。

論文 CAS PubMed Google Scholar

ミクス、P. & ズンデル、W. 低酸素症に対処しています。 セミン。 セル開発バイオル。 16(4–5)、462–473 (2005)。

論文 CAS PubMed PubMed Central Google Scholar

レベット、DZ 他。 人間の低酸素症への適応における窒素酸化物の役割。 科学。 議員 1、109 (2011)。

記事 PubMed PubMed Central Google Scholar

ロペス・コルテス、A. et al. 先天的に痛みに鈍感で無汗症を患う、高地に住むネイティブアメリカンのエクアドル人患者の臨床、ゲノミクス、ネットワーク分析:症例報告。 BMC医学。 ジェノム。 13(1)、113 (2020)。

記事 CAS Google Scholar

Zhao, Y. et al. 高地と低地におけるチベット豚の精子の比較プロテオミクス分析。 BMCジェノム。 20(1)、569 (2019)。

記事 Google Scholar

Xin、J.ら。 クロマチンのアクセシビリティ状況と高地低酸素適応の規制ネットワーク。 ナット。 共通。 11(1)、4928 (2020)。

論文 MathSciNet CAS PubMed PubMed Central Google Scholar

アーマド、Y.ら。 低圧誘発性低酸素肺のプロテオーム: バイオマーカー発見のための時間的プロテオーム プロファイリングからの洞察。 科学。 議員 5、10681 (2015)。

記事 PubMed PubMed Central Google Scholar

リファレンスをダウンロードする

データ収集にご協力いただいた Shikha Jain さん、Ruchi さん、Jaspreet さん、Avinksha Kathpalia さん、Radhika さんに感謝します。

Defense Institute of Physiology and Allied Sciences、Lucknow Road、ティマルプール、ニューデリー、110054、インド

アプールブ・グプタ、サンディヤ・パタク、ラジーブ・ヴァルシュニー、ヤスミン・アハマド、パンカジ・クラナ

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

AG、PK、RV がこのアイデアを概念化しました。 AG と PK がデータを厳選しました。 PK は機能を設計し、ネットワークをキュレーションしました。 SP は意味上の類似点を厳選しました。 AG と PK が原稿を書き、修正しました。

パンカジ・クラナ氏への対応。

著者らは競合する利害関係を宣言していません。

シュプリンガー ネイチャーは、発行された地図および所属機関における管轄権の主張に関して中立を保ちます。

オープン アクセス この記事はクリエイティブ コモンズ表示 4.0 国際ライセンスに基づいてライセンスされており、元の著者と情報源に適切なクレジットを表示する限り、あらゆる媒体または形式での使用、共有、翻案、配布、複製が許可されます。クリエイティブ コモンズ ライセンスへのリンクを提供し、変更が加えられたかどうかを示します。 この記事内の画像またはその他のサードパーティ素材は、素材のクレジットラインに別段の記載がない限り、記事のクリエイティブ コモンズ ライセンスに含まれています。 素材が記事のクリエイティブ コモンズ ライセンスに含まれておらず、意図した使用が法的規制で許可されていない場合、または許可されている使用を超えている場合は、著作権所有者から直接許可を得る必要があります。 このライセンスのコピーを表示するには、http://creativecommons.org/licenses/by/4.0/ にアクセスしてください。

転載と許可

Gupta、A.、Pathak、S.、Varshney、R. 他。 HighAltitudeOmicsDB は、高地に関連する遺伝子やタンパク質、ネットワーク、意味的類似性に関する統合リソースです。 Sci Rep 13、9307 (2023)。 https://doi.org/10.1038/s41598-023-35792-3

引用をダウンロード

受信日: 2021 年 7 月 23 日

受理日: 2023 年 5 月 24 日

公開日: 2023 年 6 月 8 日

DOI: https://doi.org/10.1038/s41598-023-35792-3

次のリンクを共有すると、誰でもこのコンテンツを読むことができます。

申し訳ございませんが、現在この記事の共有リンクは利用できません。

Springer Nature SharedIt コンテンツ共有イニシアチブによって提供

コメントを送信すると、利用規約とコミュニティ ガイドラインに従うことに同意したことになります。 虐待的なもの、または当社の規約やガイドラインに準拠していないものを見つけた場合は、不適切としてフラグを立ててください。