包含 1001 条 YouTube 评论的示例数据集![]()
一个包含 1000 多条记录的 YouTube 数据集示例。该数据集使用Bright Data API提取。
YouTube 数据集中包含的部分数据点:
comment_id:每条评论的唯一标识符comment_text:评论文本内容likes:评论获得的点赞数replies:评论的回复数量username:评论者的用户名username_md5:用户名字段的 MD5 哈希user_channel:评论者的 YouTube 频道链接date:评论发布日期url:该评论所在的 YouTube 视频链接video_id:YouTube 视频的唯一标识符replies_value:回复内容数组replies_without_names:未包含用户名的回复
还有更多。
这是从 “YouTube comments” 数据集中抽取的样本子集,完整数据集包含超过1110 万条记录。
其他可用的 YouTube 数据集:
YouTube 帖子数据集,包含13 亿条记录
YouTube 个人资料数据集,包含2960 万条记录
可用的数据集文件格式:JSON、NDJSON、JSON Lines、CSV 或 Parquet。可选地,文件可压缩为 .gz。
数据集交付方式:电子邮件、API 下载、Webhook、Amazon S3、Google Cloud Storage、Google Cloud Pub/Sub、Microsoft Azure、Snowflake、SFTP。
更新频率:一次性、每日、每周、每月、每季度,或自定义。
可在已提取数据点基础上进行数据丰富:按需提供。
获取完整的 YouTube 数据集。
YouTube 数据集有哪些应用场景?
1. 消费者情绪
洞察订阅者对你品牌的看法。通过收集评论、话题标签、提及与点赞,监测品牌与产品在 YouTube 上的口碑,以提升品牌声誉并改进服务。
2. 内容创作
利用 YouTube 数据集发掘热门视频、流行形式与高互动内容的洞察。据此优化视频内容,提升覆盖与受众参与度。
3. 市场分析
借助 YouTube 数据集分析竞争对手的内容与活跃度,识别能驱动互动的内容类型,并了解创作者对其品牌与服务的评价。
为学术研究者和非政府组织提供免费的网络采集工具与数据集
Bright Initiative 向领先的高校与研究人员、以及推动各类环境与社会公益事业的 NGO/NPO,提供对 Bright Data 的Web Scraper API与即用型数据集的访问权限。您可以在此处提交申请。