data|data collect

const collectTextline: DataCollectType = async (args: ArgsType): Promise => { const { uri, dataDir } = args; await fs.copy(uri, dataDir + '/my-own-dataset.csv'); return null; }; export default collectTextline;

【data|data collect】插件的输入是 ArgsType,输出是 void,那么来看看 data process 插件:
const doubleSize: DataProcessType = async (sample: Sample, metadata: Metadata, args?: ArgsType): Promise => { // double the data sample.data = https://www.it610.com/article/sample.data * 2; }; export default doubleSize;

看,无论是输入的参数还是函数返回值,都不一样了。但读者也不需要害怕,Pipcook 中的插件类型都是固定的,并且每一种插件的写法和类型定义也都定义好了,具体可以阅读 Pipcook 的插件规范文档。
另外,正如在开篇所说的,Pipcook 通过 Boa 提供了无缝接入 Python 生态的能力,也正因为这种能力,才帮助 JavaScript 社区解决了机器学习生态成熟度和前沿技术使用的问题,那么究竟如何开始使用 Boa 呢?
首先,在 package.json 中的依赖中添加 @pipcook/boa 及对应版本,另外在 “conda.dependencies” 中添加依赖的 Python 包,然后就能在插件中使用了:
const boa = require('@pipcook/boa'); const tensorflow = boa.import('tensorflow');

    推荐阅读