该数据集是与学术项目协调使用的公共推特更新的集合,用于研究与推特相关的地理定位数据。训练集包含 115,886 个 Twitter 用户和来自用户的 3,844,612 个更新。用户的所有位置都在美国以城市级粒度进行自我标记。测试集包含 5,136 个 Twitter 用户和来自用户的 5,156,047 条推文。用户的所有位置都是从他们的智能手机以“UT:纬度,经度”的形式上传的。 Plea
该数据集是与学术项目协调使用的公共推特更新的集合,用于研究与推特相关的地理定位数据。训练集包含 115,886 个 Twitter 用户和来自用户的 3,844,612 个更新。用户的所有位置都在美国以城市级粒度进行自我标记。测试集包含 5,136 个 Twitter 用户和来自用户的 5,156,047 条推文。用户的所有位置都是从他们的智能手机以“UT:纬度,经度”的形式上传的。
Please cite the following paper when using the dataset.
Z. Cheng, J. Caverlee, and K. Lee. You Are Where You Tweet: A Content-Based Approach to Geo-locating Twitter Users. In Proceeding of the 19th ACM Conference on Information and Knowledge Management (CIKM), Toronto, Oct 2010. (Bibtex)
预测社交网络(例如Twitter)上用户的地理位置是近期的热门研究主题,已经提出了多种方法。大多数现有的研究都遵循基于内容或基于连接两种方法:前者基于用户生成的内容,而后者发掘用户之间社交网络的结构。
多入口神经网络结构
有一种更通用的方法,这种方法不仅包含前述两种方法,还融入了其他可获取的信息去创建一个统一的模型。这种叫Multi-Entry Neural Network (MENET)的方法,利用了最新的深度学习和多视角学习成果。
利用文本,网络,和原始数据特征来实现的MENET方法,能有效发掘Twitter用户的地理位置,在2个公认的数据集上实现了应用的最高水准。
湖北省主要雨量站雨情数据,2000年至2022年最新 湖北省雨情数据,总共6000+(月均为4000左右站点)监测站点,包含行政区编码名称,站点编码名称,时间,时段降水量mm,时段长,降水历时,日降水量mm,天气等信息,数据总量2.6亿条,11G。
包含全国水文监测点名称,行政区,流域,水系,编码,经度,纬度,河流,站类代码,站点类型,地址,时间,数据来源:全国雨水情信息
全国机场信息包含全国所有民航机场, 高原机场, 高高原机场,特殊机场名单,每个机场上的机场IATA编号,机场ICAO编号,机场等级,机场海拔,机场性质,机场跑道数量,机场最大跑道长度,机场经度,机场纬度,机场运送人次,机场电话,机场地址,机场历年旅客吞吐量,机场历年货邮架次,机场历年起降架次等信息。
本数据集包含23类皮肤病的图像数据,图像总数约为 19,500 张,其中大约 15,500 张已在训练集中分割,其余在测试集中分割。 Acknowledgements The images are taken from the public portal Dermnet (http://www.dermnet.com/) which is the largest dermatology sou