+关注
已关注

分类  

暂无分类

标签  

暂无标签

日期归档  

暂无数据

如何从c3.ai Covid Datalake获取所有蛋白质序列?

发布于2021-03-02 15:35     阅读(587)     评论(0)     点赞(2)     收藏(3)


0

1

2

3

4

5

6

7

8

9

我想下载所有SARS-CoV-2菌株的所有当前已知的蛋白质序列。我不确定如何

import requests
import pandas as pd

from matplotlib import pyplot as plt
from scipy.stats import gamma
import numpy as np

import c3aidatalake

url = 'https://api.c3.ai/covid/api/1/sequence/fetch'

json_request = {
  "spec": {
      "filter": "sequenceType == 'complete'",
      "limit": 10
  }
}

headers = {
    'Accept': 'application/json',
    'Content-Type': 'application/json'
}

response = requests.post(url=url, json=json_request, headers=headers)

response

result = response.json()

result

该请求返回如下内容:

   {'objs': [{'type': 'ProteinSequence',
   'id': 'BCA87360',
   'meta': {'tenantTagId': 4,
    'tenant': 'covid',
    'tag': 'prod',
    'created': '2020-06-06T14:51:45Z',
    'createdBy': 'dataloader',
    'updated': '2020-11-16T06:03:38Z',
    'updatedBy': 'dataloader',
    'timestamp': '2020-11-16T06:03:49Z',
    'sourceFile': 'proteins_sequence_metadata.csv',
    'fetchInclude': '[]',
    'fetchType': 'Sequence'},
   'version': 65539,
   'parent': {'id': 'BCA87360'},
   'sequence': 'MESLVPGFNEK...',
   'sequenceType': 'complete',
   'length': 7096,
   'typeIdent': 'PRTN'},

我想,我需要过滤该'objs': [{'type': 'ProteinSequence',字段的结果但是我对弹性搜索语法不太熟悉。

https://c3.ai/covid-19-api-documentation/#tag/BiologicalAsset/paths/~1api~11~1biologicalasset~1fetch/post


解决方案


暂无回答

0

1

2

3

4

5



所属网站分类: 技术文章 > 问答

作者:黑洞官方问答小能手

链接: https://www.pythonheidong.com/blog/article/869888/d5342324b2040063ae72/

来源: python黑洞网

任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任

2 0
收藏该文
已收藏

评论内容:(最多支持255个字符)