YouTube 数据集示例
2026/6/6 4:22:43 网站建设 项目流程

包含 1001 条 YouTube 评论的示例数据集

一个包含 1000 多条记录的 YouTube 数据集示例。该数据集使用Bright Data API提取。

YouTube 数据集中包含的部分数据点:

  • comment_id:每条评论的唯一标识符
  • comment_text:评论文本内容
  • likes:评论获得的点赞数
  • replies:评论的回复数量
  • username:评论者的用户名
  • username_md5:用户名字段的 MD5 哈希
  • user_channel:评论者的 YouTube 频道链接
  • date:评论发布日期
  • url:该评论所在的 YouTube 视频链接
  • video_id:YouTube 视频的唯一标识符
  • replies_value:回复内容数组
  • replies_without_names:未包含用户名的回复

还有更多。

这是从 “YouTube comments” 数据集中抽取的样本子集,完整数据集包含超过1110 万条记录

其他可用的 YouTube 数据集:

  • YouTube 帖子数据集,包含13 亿条记录

  • YouTube 个人资料数据集,包含2960 万条记录

可用的数据集文件格式:JSON、NDJSON、JSON Lines、CSV 或 Parquet。可选地,文件可压缩为 .gz

数据集交付方式:电子邮件、API 下载、Webhook、Amazon S3、Google Cloud Storage、Google Cloud Pub/Sub、Microsoft Azure、Snowflake、SFTP

更新频率:一次性、每日、每周、每月、每季度,或自定义

可在已提取数据点基础上进行数据丰富:按需提供

获取完整的 YouTube 数据集

YouTube 数据集有哪些应用场景?

1. 消费者情绪

洞察订阅者对你品牌的看法。通过收集评论、话题标签、提及与点赞,监测品牌与产品在 YouTube 上的口碑,以提升品牌声誉并改进服务。

2. 内容创作

利用 YouTube 数据集发掘热门视频、流行形式与高互动内容的洞察。据此优化视频内容,提升覆盖与受众参与度。

3. 市场分析

借助 YouTube 数据集分析竞争对手的内容与活跃度,识别能驱动互动的内容类型,并了解创作者对其品牌与服务的评价。

为学术研究者和非政府组织提供免费的网络采集工具与数据集

Bright Initiative 向领先的高校与研究人员、以及推动各类环境与社会公益事业的 NGO/NPO,提供对 Bright Data 的Web Scraper API即用型数据集的访问权限。您可以在此处提交申请。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询