LIVIA — 关于

指标定义、配色方案和参考文献

1. 预测分析

快速开始

  1. 使用任何支持的平台运行预测(AlphaFold3、AlphaFold2、ColabFold、Boltz-1/2、Chai-1 或 OpenFold3)
  2. 打开 预测分析 并上传您的预测文件(.zip、.gz、.cif、.pdb、.json、.npz、.npy)
  3. 工具自动检测预测平台并显示可用模型/等级
  4. 可选:调整 PAE 截止值(默认:12 Å)和 Cβ 截止值(默认:8 Å),然后点击 处理
  5. 探索 PAE/LIS/cLIS 图谱、评分矩阵和链对表格
  6. 点击链对表格中的一行以生成可视化脚本
  7. 下载 .cxc 脚本和结构文件,将它们放在同一文件夹中,然后在 ChimeraX 或 PyMOL 中打开脚本

支持的平台

  • AlphaFold3 — .cif + summary_confidences + full_data JSON(来自 AlphaFold Server 或本地)
  • AlphaFold2 — ranked_*.pdb + PAE JSON(PAE 必须从 .pkl 预先转换)
  • ColabFold — *_unrelaxed_rank_*.pdb + *_scores_rank_*.json
  • Boltz-1/2 — .pdb/.cif + confidence_*.json + pae_*.npz
  • Chai-1 — pred.rank_*.cif + scores.rank_*.json(PAE 在 JSON 或 .npy 中)
  • OpenFold3 — result_sample_*_model.pdb + confidences JSON
  • Tamarind Bio — 通过 Tamarind 从任何平台输出(自动检测)
  • 通用 — 任何带有 PAE JSON 文件的 .cif/.pdb

功能

  • 自动检测 — 根据文件名自动识别预测平台
  • 压缩文件 — 接受 .zip、.gz 文件;在浏览器中解压
  • PAE 图谱 — 蓝-白-红(bwr)配色,按模型/等级
  • LIS 图谱 — matplotlib Blues 配色,PAE 双向平均
  • cLIS 图谱 — matplotlib Greens 配色,接触过滤
  • 评分矩阵 — iLIS(Oranges,左下)/ ipTM(Purples,右上)
  • 残基计数矩阵 — LIR(Blues)/ cLIR(Greens)
  • 序列查看器 — 氨基酸字母带 LIR/cLIR 高亮
  • 配色预设 — 渐变、纯色、pLDDT 着色、按链着色、按聚合物着色
  • NPZ/NPY 解析器 — 在浏览器中读取 Boltz PAE(.npz)和 Chai-1 PAE(.npy)
  • 下载 — .cxc 脚本、结构文件、含完整指标的 CSV

2. 果蝇预测组分析

快速开始

  1. 前往 FlyPredictome,搜索蛋白对,然后复制预测页面 URL
  2. 打开 果蝇预测组分析,粘贴 URL 然后点击 生成
  3. 查看 全部等级 表格 — 点击任意行可在等级 1–5 之间切换
  4. 探索指标(iLIS、ipTM、LIR/cLIR 计数)、序列查看器和可视化脚本预览
  5. 下载脚本(ChimeraX 用 .cxc 或 PyMOL 用 .pml)和结构文件,将它们放在同一文件夹中,然后在 ChimeraX 或 PyMOL 中打开脚本

功能

  • 全部等级表格 — 显示所有 5 个排序模型的 iLIS、LIS、cLIS、ipTM、LIR/cLIR 计数;点击任意行可加载该等级
  • 序列查看器 — 显示每条链的实际氨基酸字母,带 LIR(浅色)和 cLIR(深色)高亮
  • 可视化脚本 — 语法高亮预览,含配色预设(渐变、纯色、着色模式);交换 A ↔ B 按钮可反转链颜色
  • 线性接触图谱 — 连线连接物理接触中的 cLIR 残基对,颜色从链 A 渐变到链 B
  • 环形接触图谱 — 环形弦图显示链弧(与长度成比例)和连接接触中 cLIR 残基对的连线
  • 下载 — .cxc 脚本、.pdb 结构和含所有等级完整指标的 CSV

3. 同源相互作用组

快速开始

  1. 打开 同源相互作用组 并搜索人类基因(例如 CDK2TP53
  2. 浏览相互作用伙伴表格 — 点击任意行加载详情页
  3. 或在粘贴 URL 标签页中直接粘贴 famdb_details_ortho URL
  4. 查看等级、接触图谱、3D 查看器和可视化脚本
  5. 下载 ChimeraX 或 PyMOL 用的脚本和结构文件

功能

  • 基因搜索 — UniProt 自动补全,含物种选择器(人类、小鼠、斑马鱼、线虫、酵母)
  • 伙伴表格 — 显示 iLIS(最佳/平均)、ipTM、蛋白长度;可按 iLIS 阈值过滤
  • 预构建示例 — CDK2–CCNA2、TP53–MDM2、MAPK14–MKNK1、ABL1–CRK 等
  • MIST 集成 — 显示来自 MIST 数据库的已报道相互作用
  • 完整分析流程 — 与 FlyPredictome 相同(等级、接触图谱、Mol* 查看器、脚本)

4. AlphaFold DB 二聚体分析

快速开始

  1. 打开 AlphaFold DB 二聚体分析 并输入 UniProt ID(例如 P69905)、模型实体 ID(例如 AF-0000000066214167)或完整 AlphaFold DB URL
  2. 点击 搜索二聚体 — 将出现可用二聚体复合物表格,含 LIS、ipTM 和 ipSAE 评分
  3. 点击表格中的二聚体行进行加载 — 工具会自动从 AlphaFold DB 获取 CIF 和 PAE 数据
  4. 查看 PAE/LIS/cLIS 图谱、评分矩阵、序列查看器和指标(iLIS、LIS、cLIS、ipTM、ipSAE)
  5. 下载脚本(.cxc/.pml)和结构文件,将它们放在同一文件夹中,然后在 ChimeraX 或 PyMOL 中打开脚本

功能

  • 灵活输入 — 接受 UniProt ID、AlphaFold 模型实体 ID 或完整 AlphaFold DB URL
  • 二聚体搜索表格 — 列出蛋白的所有可用二聚体预测,含复合物名称、类型、基因名称、LIS、ipTM 和 ipSAE;点击任意行可选择
  • 从 AlphaFold DB 自动获取 — CIF 结构和 PAE 矩阵直接从数据库获取
  • PAE/LIS/cLIS 图谱 — 与通用工具相同的配色(bwr、Blues、Greens)
  • 评分矩阵 — iLIS(Oranges)/ cLIR 计数(Greens)
  • 序列查看器 — 氨基酸字母带 LIR(浅色)和 cLIR(深色)每链高亮
  • ipSAE 指标 — 来自对齐误差的相互作用预测评分(Dunbrack, 2025
  • actifpTM 指标 — 实际界面 pTM(Varga et al., 2025
  • 可视化脚本 — 配色预设含交换 A ↔ B 支持
  • 下载 — .cxc 脚本、.cif 结构、含完整指标和 LIR/cLIR 索引的 CSV

5. AlphaFold DB 单体结构域分析

快速开始

  1. 打开 AlphaFold DB 单体结构域分析 并输入 UniProt ID(例如 P31749)— 输入时会出现自动补全建议
  2. 点击 获取 — 工具从 AlphaFold DB 检索 PDB 结构和 PAE 矩阵
  3. 结构域使用基于 pLDDT 的分割 自动检测;如有需要可调整设置(最小长度、合并 LIS 阈值、pLDDT 截止值)
  4. 点击 检测结构域 以新设置重新检测,或手动编辑结构域边界
  5. 查看 PAE/LIS/cLIS 图谱、结构域间的 iLIS/cLIR 评分矩阵和序列查看器
  6. 下载脚本(.cxc/.pml)和结构文件,将它们放在同一文件夹中,然后在 ChimeraX 或 PyMOL 中打开脚本

功能

  • 从 AlphaFold 数据库自动获取 — 通过 UniProt ID 直接获取 PDB 结构和 PAE 矩阵
  • 基于 LIS/pLDDT 的结构域检测 — 使用平滑的逐残基 pLDDT 评分和相邻片段间的 LIS 自动检测结构域边界,含可调参数:
    • 最小区域长度(默认:15 个残基)
    • 合并 LIS 阈值(默认:0.35)— 具有高相互 LIS 的相邻区域将被合并(越高 = 越少合并)
    • pLDDT 截止值(默认:50)— 低于此值的残基被视为无序连接子
  • 分子内 iLIS — 计算所有检测到的结构域对之间的 iLIS,以量化结构域–结构域相互作用
  • 评分矩阵 — 结构域间的 iLIS(Oranges,左下)/ cLIR 计数(白到绿,右上)
  • PAE/LIS/cLIS 图谱 — 与通用工具相同的配色(bwr、Blues、Greens),叠加结构域边界
  • 序列查看器 — 氨基酸字母带 LIR(浅色)和 cLIR(深色)每结构域对高亮
  • 脚本预设 — 结构域着色视图(默认)、pLDDT 着色、按链着色、按聚合物着色
  • 下载 — .cxc 脚本、.pdb 结构、含结构域对指标的 CSV

LIR 显示选项

所有工具均包含可调节的 LIR 显示设置,影响可视化脚本和 3D 查看器:

  • 间隙填充(默认:10 个残基)— 桥接 LIR 区域间的短断裂以显示连续卡通图。
  • 最小片段(默认:3 个残基)— 移除短于阈值的孤立 LIR 片段。被移除片段内的 cLIR 残基也会被移除。

更改数值后点击 应用 以更新可视化脚本和 3D 查看器。

序列查看器

所有四个工具均包含 序列查看器,用于显示每条链或结构域的实际氨基酸序列(单字母代码)。残基根据其相互作用状态进行着色:

A K L
LIR 残基(浅色)
R D E
cLIR 残基(深色,粗体白色)
G P S
非相互作用残基

残基编号以间隔显示。查看器水平滚动以显示长序列。

配色方案参考

图谱配色

所有工具对图谱和矩阵使用一致、固定的配色。这些不受配色预设影响。

图谱配色刻度
PAE 图谱蓝色 – 白色 – 红色(bwr)0 Å(可信) → 30 Å(不确定)
LIS 图谱matplotlib Blues0 → 1(越高 = 相互作用越强)
cLIS 图谱matplotlib Greens0 → 1(越高 = 接触过滤后的相互作用越强)
评分矩阵(iLIS)matplotlib Oranges左下三角
评分矩阵(cLIR / ipTM)白色 → 绿色(或 Purples 用于 ipTM)右上三角

可视化脚本颜色

可视化脚本(ChimeraX 用 .cxc,PyMOL 用 .pml)使用链颜色,您可以通过预设进行自定义。默认为青色/珊瑚色渐变。

链 A — LIR(浅青色)
链 A — cLIR(深青色)
链 B — LIR(浅珊瑚色)
链 B — cLIR(深珊瑚色)
  • 渐变 — LIR 用浅色,cLIR 用深色(如:蓝/橙、紫/金、青/珊瑚)
  • 纯色 — LIR 和 cLIR 使用相同颜色
  • 命名颜色 — 熟悉的颜色(Cornflower/Tomato、SkyBlue/Gold 等)
  • 多链(tab10) — 为每条链自动分配不同颜色,用于超过 2 条链的复合物
  • 交换 A ↔ B 按钮 — 反转链颜色而不改变颜色组合

着色模式预设

单体工具在默认结构域着色视图之外提供额外的着色预设:

  • pLDDT 着色 — 按 AlphaFold 置信度对残基着色:很高(>90)可信(70–90)低(50–70)很低(<50)
  • 按链着色 — 链着色
  • 按聚合物着色 — 聚合物着色

应用颜色更改

选择预设时,配色预设和自定义颜色会自动更新可视化脚本(ChimeraX/PyMOL)。PAE/LIS/cLIS 图谱使用固定色标,不受颜色选择影响。

AFM-LIS 指标

指标全称定义
iLIS集成 LIS√(LIS × cLIS) — LIS 和 cLIS 的几何平均;结合可信结构域和可信接触的平衡评分
LIS局部相互作用评分LIA 内反向缩放 PAE 的平均值(0–1,越高越好)
cLIS接触过滤 LIScLIA 内反向缩放 PAE 的平均值
LIR局部相互作用残基可信相互作用区域中的残基(PAE ≤ 12 Å)
cLIR接触过滤 LIR直接物理接触中的残基(PAE ≤ 12 Å & Cβ ≤ 8 Å)
LIA局部相互作用区域可信相互作用区域(PAE ≤ 12 Å)
cLIA接触过滤 LIA接触距离内的可信相互作用区域(PAE ≤ 12 Å & Cβ ≤ 8 Å)
iLIA集成 LIA√(LIA × cLIA) — 可信界面面积和接触支持界面面积的几何平均;反映经接触密度加权的界面大小
iLISA集成 LIS-面积iLIS × iLIA — 结合界面置信度(iLIS)与界面大小(iLIA)的复合评分;用于排序置信度相当但大小不同的界面

默认截止值:PAE ≤ 12 Å(可信相互作用)和 Cβ ≤ 8 Å(直接接触)。这些可在通用工具和二聚体工具中处理前进行调整。

PAE 转换:对于每条链间残基对 (i, j),PAE 值被转换为置信度评分:confidence = 1 − (PAE / cutoff)(若 PAE ≤ cutoff,否则为 0)。这线性映射 PAE = 0 Å 到置信度 = 1.0(最高),PAE = cutoff 到 0。PAE 截止值 12 Å 通过 ROC 分析确定以最大化 AUC(Kim et al., 2024)。

LIS 计算:LIA(局部相互作用区域)是 PAE ≤ 截止值的链间残基对计数。LIS 是所有 LIA 对的平均置信度评分。cLIA 进一步限制为也在物理接触中的对(Cβ ≤ 8 Å),cLIS 是 cLIA 内的平均置信度。链间 PAE 块通过平均 (A→B) 和 (B→A) 方向进行对称化。iLIS = √(LIS × cLIS),将界面置信度与直接接触证据结合为单个稳健指标(Kim et al., 2026)。还报告了两个派生的大小加权指标以供参考:iLIA = √(LIA × cLIA) 总结界面大小,iLISA = iLIS × iLIA 结合界面置信度与大小。这些辅助指标可能有助于区分 iLIS 相似但界面大小不同的预测。

额外置信度指标:ipSAE(来自对齐误差的相互作用预测评分;Dunbrack, 2025)在接触残基上使用类 PTM 评分函数对 PAE 值评分。actifpTM(实际界面 pTM;Varga et al., 2025)。

接触图谱:基于 Cβ 原子距离构建(甘氨酸用 Cα)。两个残基的 Cβ–Cβ 距离 ≤ 8 Å 即为接触。对于核酸,使用磷(P)原子,距离调整到 4 Å。

对称化:链对 (A→B) 和 (B→A) 的结果取平均。LIR/cLIR 残基集为所有模型的并集。

建议阈值:iLIS ≥ 0.223 使用酵母大规模 Y2H 参考数据集在 10% FPR 下建立(Yu et al., 2008),果蝇(Tang et al., 2023),和人类(Braun et al., 2009)。该阈值使用 AlphaFold-Multimer 预测(通过 ColabFold)确定。详见 Kim et al., 2026

注意:计算预测应谨慎解读。iLIS ≥ 0.223 阈值源自 AlphaFold-Multimer(ColabFold)预测与特定参考数据集。其他预测平台(AlphaFold 3、Boltz、Chai-1、OpenFold)可能需要不同的截止值,因为模型架构、训练数据和置信度校准存在差异。各平台产生不同的 PAE 分布和 ipTM 标度,这会影响 iLIS 值。最佳阈值也可能因物种、蛋白类型和实验系统而异。在根据预测相互作用得出生物学结论之前,强烈建议进行实验验证

批量分析

对于大规模批量分析大量预测,请使用 AFM-LIS 仓库中的 lis.py。它支持所有相同的平台(AlphaFold3、ColabFold、Boltz、Chai-1、OpenFold3),自动检测预测格式,并输出 CSV。

python lis.py /path/to/predictions/
python lis.py /path/to/predictions/ -w 4  # 使用 4 个 CPU 并行

功能:.gz/.xz 解压、增量 CSV 输出(可安全中断和恢复)、带 ETA 的进度条。

参考文献

AFM-LIS

  • Kim et al. 2024 — Enhanced Protein-Protein Interaction Discovery via AlphaFold-Multimer. bioRxiv.
  • Kim et al. 2026 — FlyPredictome: A structural atlas of predicted protein-protein interactions in Drosophila. bioRxiv.
  • AFM-LIS GitHub — Code and documentation for calculating integrated Local Interaction Score (iLIS)

结构预测

  • Jumper et al. 2021 — Highly accurate protein structure prediction with AlphaFold. Nature 596, 583–589.
  • Evans et al. 2022 — Protein complex prediction with AlphaFold-Multimer. bioRxiv.
  • Abramson et al. 2024 — Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature 630, 493–500.
  • Mirdita et al. 2022 — ColabFold: making protein folding accessible to all. Nature Methods 19, 679–682.

置信度指标

  • Dunbrack 2025Rēs ipSAE loquuntur: What’s wrong with AlphaFold’s ipTM score and how to fix it. bioRxiv.
  • Varga et al. 2025 — actifpTM: a refined confidence metric of AlphaFold2 predictions involving flexible regions. Bioinformatics 41(3), btaf107.

Y2H 参考数据集(iLIS 基准)

  • Yu et al. 2008 — High-quality binary protein interaction map of the yeast interactome network. Science 322, 104–110.
  • Tang et al. 2023 — Next-generation large-scale binary protein interaction network for Drosophila melanogaster. Nature Communications 14, 2162.
  • Braun et al. 2009 — An experimentally derived confidence score for binary protein-protein interactions. Nature Methods 6, 91–97.

可视化工具

  • Sehnal et al. 2021 — Mol* Viewer: modern web app for 3D visualization and analysis of large biomolecular structures. Nucleic Acids Research 49, W431–W437.
  • Pettersen et al. 2021 — UCSF ChimeraX: Structure visualization for researchers, educators, and developers. Protein Science 30, 70–82.
  • The PyMOL Molecular Graphics System, Schrödinger, LLC. pymol.org

数据库

  • UniProt Consortium 2023 — UniProt: the Universal Protein Knowledgebase in 2023. Nucleic Acids Research 51, D523–D531.
  • Varadi et al. 2022 — AlphaFold Protein Structure Database: massively expanding the structural coverage of protein-sequence space with high-accuracy models. Nucleic Acids Research 50, D439–D444.
  • Han et al. 2026 — AlphaFold Database expands to proteome-scale quaternary structures. bioRxiv.
  • Kim et al. 2026 — FlyPredictome: A structural atlas of predicted protein-protein interactions in Drosophila.
  • Kim et al. 2025 — A Structure-Guided Kinase–Transcription Factor Interactome Atlas Reveals Docking Landscapes of the Kinome. bioRxiv.
  • Hu et al. 2018 — Molecular Interaction Search Tool (MIST): an integrated resource for mining gene and protein interaction data. Nucleic Acids Research 46(D1), D567–D574.
  • Paysan-Lafosse et al. 2023 — InterPro in 2022. Nucleic Acids Research 51(D1), D418–D427.
  • Ozturk-Colak et al. 2024 — FlyBase: updates to the Drosophila genes and genomes database. Genetics 227(1), iyad211.

本工具

  • Kim & Perrimon 2026 — LIVIA: a browser-based tool for assessing and visualizing predicted protein interactions. bioRxiv.

引用本工具

如果您在研究中使用 LIVIA,请引用:

Kim, A.-R. & Perrimon, N. (2026). LIVIA: a browser-based tool for assessing and visualizing predicted protein interactions. bioRxiv. https://doi.org/10.64898/2026.05.01.721633

如果您使用 LIS 或 iLIS 指标,请同时引用:

Kim, A.-R. et al. (2024). Enhanced Protein-Protein Interaction Discovery via AlphaFold-Multimer. bioRxiv. https://doi.org/10.1101/2024.02.19.580970
Kim, A.-R. et al. (2026). FlyPredictome: A structural atlas of predicted protein-protein interactions in Drosophila. bioRxiv. https://doi.org/10.64898/2026.04.14.718529