几行代码即可高效创建数据集，谷歌开源 TFRecorder

　　在训练计算机视觉机器学习模型时，数据加载常常会成为性能瓶颈，导致在等待将数据加载到模型中时 GPU 或 TPU 资源的利用率不足。以 TFRecord 格式存储数据集是一个行之有效的方法，然而，创建 TFRecord 通常需要大量的复杂代码。

　　于是，谷歌近期开源了 TensorFlow Recorder（即 TFRecorder）项目，旨在简化 TFRecord 的创建流程。TFRecord 是一种二进制文件格式，处理数据相对高效，但要将其他数据转为 TFRecord 较为麻烦，通常需要编写一个数据管道来解析结构化数据，从存储中加载图像，然后再将结果序列化为 TFRecord 格式。而此次开源的 TFRecorder 能够直接从 Pandas dataframe 或 CSV 等格式写入 TFRecords，无需再编写复杂的代码。

　　使用 TFRecorder 创建 TFRecord 只需要几行代码，运行方式如下：　　

import pandas as pdimport tfrecorderdf = pd.read_csv (...) df.tensorflow.to_tfrecord (output_dir="gs://my/bucket")

　　TFRecorder 期望写入的数据与 Google AutoML Vision 的格式相同，也就是类似 pandas dataframe 或 CSV 的格式，例如：　　

split	image_uri	label
TRAIN	gs://my/bucket/image1.jpg	cat

　　目前，TFRecorder 支持的数据格式还很有限，将来会进一步扩展，以支持使用任何格式的数据。　　

　　对于更庞大的数据集，TFRecorder 还提供了与 Google Cloud Dataflow 的连接性，扩展到 DataFlow 仅需要多几行代码配置。

　　关于 TFRecorder 的更多信息，可查看谷歌开源博客的介绍：https://opensource.googleblog.com/2020/08/introducing-tensorflow-recorder.html

几行代码即可高效创建数据集，谷歌开源 TFRecorder

Mozilla 裁员 25%，组织重构并转向商业化探索

阿里健康：按每股20.05港元完成4.988亿股新股配售

最新文章

「经验分享」单位规模如何填写

ai复制快捷键（复制与粘贴的几种办法）

探路者和骆驼哪个好(探路者冲锋衣什么档次)

太监怎么净身（揭秘太监净身全过程）

破折号的作用

圭吾怎么读(东野圭吾什么意思)

防晒口罩巾怎样做

学困生转化措施（以及转化学困生的三项策略）

半斤多少克(一斤等于多少两)

柠檬炸鸡的做法

标签

热评文章

国内手机最新周销量排名曝光：iPhone 16系列霸榜前三

真我Neo7 SE即将发布：2K档耐玩战神＋年度续航之王

卢伟冰：Ultra用户见证了小米冲击高端非常感谢他们

潮汐app怎么听到梦话记录

电信王卡怎么查看流量剩余电信王卡怎么查看流量剩余多少(电信怎么查流量剩余)

几行代码即可高效创建数据集，谷歌开源 TFRecorder

Mozilla 裁员 25%，组织重构并转向商业化探索

阿里健康：按每股20.05港元完成4.988亿股新股配售

最新文章

「经验分享」单位规模如何填写

标签

热评文章

国内手机最新周销量排名曝光：iPhone 16系列霸榜前三

真我Neo7 SE即将发布：2K档耐玩战神＋年度续航之王

卢伟冰：Ultra用户见证了小米冲击高端 非常感谢他们

潮汐app怎么听到梦话记录

电信王卡怎么查看流量剩余 电信王卡怎么查看流量剩余多少(电信怎么查流量剩余)

关注我们的公众号

卢伟冰：Ultra用户见证了小米冲击高端非常感谢他们

电信王卡怎么查看流量剩余电信王卡怎么查看流量剩余多少(电信怎么查流量剩余)