当前位置: 首页 > news >正文

建网站难不难网站诊断分析

建网站难不难,网站诊断分析,网站建设基本要点,现在哪个网站做网站好AlphaFold3 data_transforms 模块的 squeeze_features 函数的作用去除 蛋白质特征张量中不必要的单维度(singleton dimensions)和重复维度,以使其适配 AlphaFold3 预期的输入格式。 源代码: def squeeze_features(protein):&qu…

AlphaFold3  data_transforms 模块的 squeeze_features 函数的作用去除 蛋白质特征张量中不必要的单维度(singleton dimensions)和重复维度,以使其适配 AlphaFold3 预期的输入格式。

源代码:

def squeeze_features(protein):"""Remove singleton and repeated dimensions in protein features."""protein["aatype"] = torch.argmax(protein["aatype"], dim=-1)for k in ["domain_name","msa","num_alignments","seq_length","sequence","superfamily","deletion_matrix","resolution","between_segment_residues","residue_index","template_all_atom_mask",]:if k in protein:final_dim = protein[k].shape[-1]if isinstance(final_dim, int) and final_dim == 1:if torch.is_tensor(protein[k]):protein[k] = torch.squeeze(protein[k], dim=-1)else:protein[k] = np.squeeze(protein[k], axis=-1)for k in ["seq_length", "num_alignments"]:if k in protein:protein[k] = protein[k][0]return protein

源码解读:

  • 该函数接收 protein(一个 包含蛋白质特征的字典)作为输入。
  • 主要任务:
    1. 将 one-hot aatype 转换为索引表示
    2. 移除 shape 为 (N, ..., 1) 的单维度
    3. 提取 seq_length 和 num_alignments 的实际数值
Step 1: 处理 aatype
protein["aatype"] = torch.argmax(protein["aatype"], dim=-1)
  • 输入 aatype(氨基酸类型)通常是 one-hot 编码
  • 通过 torch.argmax(..., dim=-1) 获取 索引
  • 目的:简化 aatype 的数据表示,使其直接存储氨基酸索引,而不是 one-hot 矩阵。
Step 2: 移除单维度
for k in ["domain_name","msa","num_alignments","seq_length","sequence","superfamily","deletion_matrix","resolution","between_segment_residues","residue_index","template_all_atom_mask",
]:if k in protein:final_dim = protein[k].shape[-1]  # 获取最后一维的大小if isinstance(final_dim, int) and final_dim == 1:if torch.is_tensor(protein[k]):protein[k] = torch.squeeze(protein[k], dim=-1)  # 去掉单维度else:protein[k] = np.squeeze(protein[k], axis=-1)
  • 遍历多个 protein 特征字段,检查它们是否存在。
  • 如果最后一维 final_dim 为 1,说明这个维度是无意义的单维度,需要去除:
    • 如果是 PyTorch 张量torch.Tensor),使用 torch.squeeze(dim=-1)
    • 如果是 NumPy 数组,使用 np.squeeze(axis=-1)
Step 3: 处理 seq_length 和 num_alignments
for k in ["seq_length", "num_alignments"]:if k in protein:protein[k] = protein[k][0]

seq_length 和 num_alignments 可能是 列表或张量,但它们的数值其实是一个单独的整数,因此需要转换成 标量值

结论

1️⃣ 转换 aatype: 从 one-hot 编码 转换成 索引表示
2️⃣ 移除无用的单维度: 让 msaresolutiondeletion_matrix 等数据符合 AlphaFold3 预期格式。
3️⃣ 转换 seq_length 和 num_alignments 为标量: 确保它们不会以张量形式存在,而是整数。

💡 最终作用:保证输入数据的维度符合 AlphaFold3 训练时的输入要求,提高数据处理效率。

http://www.dt0577.cn/news/40603.html

相关文章:

  • 商务网站建设的基本流程在线生成个人网站源码
  • 青岛互联网设计公司英文谷歌优化
  • 网络工作室创业项目网站优化外包公司
  • 网站制作答辩ppt怎么做nba最新消息
  • 竞价网站做推广方案公司seo是什么级别
  • 开发区招聘seo好找工作吗
  • 做app 的模板下载网站有哪些洛阳seo网络推广
  • 做和别人类似的网站侵权吗免费推广的网站
  • 产品介绍网站如何做seo百度后台登录
  • 学校网站建设企业代做百度首页排名价格
  • 登录网址鸡西seo顾问
  • 北京西路做网站的公司我要软文网
  • 电商网站建设精英想学网络营销怎么学
  • php网站培训台州百度快照优化公司
  • 网站业务数字营销案例
  • 专题网站开发报价下载谷歌浏览器并安装
  • 怎么做网站图片seo整站优化包年
  • wordpress管理用户插件搜索引擎seo是什么
  • 为什么百度搜出来的网站只有网址没有网站名和网页摘要.青岛网站建设优化
  • 标准网站建设哪家便宜seo的内容主要有哪些方面
  • 竞价网站移动端优化培训学校
  • dede网站禁止ip访问郑州网站优化顾问
  • 基于web的网站建设步骤google搜索下载
  • 如何快速做网站关键词企业网上的推广
  • 做国外有那些网站比较好的交换友情链接的渠道有哪些
  • 做网站公司(深圳信科)最快新闻资讯在哪看
  • 木樨园网站建设公司seo推广方法集合
  • 厦门同安区建设局网站百度搜索关键词排名人工优化
  • 织梦单页面网站模板百度一下百度首页官网
  • 购物网站建设服务广州seo全网营销