Twitter地理定位信息数据集

订阅方案:
普通用户:
¥30.00
VIP用户:
¥0.00
联系客服 查看订阅方案
所属分类: 综合数据 标签: (无)
来源: Moonapi
更新时间: 2024-04-28 最新数据时间: 自动更新
数据集简介:

该数据集是与学术项目协调使用的公共推特更新的集合,用于研究与推特相关的地理定位数据。训练集包含 115,886 个 Twitter 用户和来自用户的 3,844,612 个更新。用户的所有位置都在美国以城市级粒度进行自我标记。测试集包含 5,136 个 Twitter 用户和来自用户的 5,156,047 条推文。用户的所有位置都是从他们的智能手机以“UT:纬度,经度”的形式上传的。   Plea

展开
  • 质量保证
  • 免费样本数据
  • 免费数据更新
  • 提供发票
数据集概览(文件数量,文件种类,数据集行列数),数据集示例数据请查看下方数据集介绍或联系客服索取
    • 数据集介绍
    • 订阅方案
    • 问题反馈

    Twitter地理定位信息数据集简介

    该数据集是与学术项目协调使用的公共推特更新的集合,用于研究与推特相关的地理定位数据。训练集包含 115,886 个 Twitter 用户和来自用户的 3,844,612 个更新。用户的所有位置都在美国以城市级粒度进行自我标记。测试集包含 5,136 个 Twitter 用户和来自用户的 5,156,047 条推文。用户的所有位置都是从他们的智能手机以“UT:纬度,经度”的形式上传的。

    Please cite the following paper when using the dataset.

     

    Z. Cheng, J. Caverlee, and K. Lee. You Are Where You Tweet: A Content-Based Approach to Geo-locating Twitter Users. In Proceeding of the 19th ACM Conference on Information and Knowledge Management (CIKM), Toronto, Oct 2010. (Bibtex)

     

     

    预测社交网络(例如Twitter)上用户的地理位置是近期的热门研究主题,已经提出了多种方法。大多数现有的研究都遵循基于内容或基于连接两种方法:前者基于用户生成的内容,而后者发掘用户之间社交网络的结构。

     

    多入口神经网络结构

    有一种更通用的方法,这种方法不仅包含前述两种方法,还融入了其他可获取的信息去创建一个统一的模型。这种叫Multi-Entry Neural Network (MENET)的方法,利用了最新的深度学习和多视角学习成果。

     

    利用文本,网络,和原始数据特征来实现的MENET方法,能有效发掘Twitter用户的地理位置,在2个公认的数据集上实现了应用的最高水准。

    推荐数据集