来源
Kaggle数据网
数据集信息
数据量:1208行
背景
这是一个预抓取的数据集,作为一个更大的数据集的子集数据集(超过61,000个属性)这是通过从StayZilla.com提取数据创建的,一家类似印度AirBnB的初创公司成立于2005年,于2017年关闭。
数据字段
additional_info:附加信息,关于该物业的特殊考虑
amenities:舒适,管道,分隔酒店的设施列表
check_in_date:入住日期
check_out_date:退房日期
city:城市
country:国家
crawl_date:爬网日期
description:描述,财产的描述,由列表输入网站
highlight_value:突出显示值,由列表者输入到站点的属性突出显示
hotel_star_rating:酒店,星级,如果该物业是酒店,则为五星级以外的等级,不是所有的酒店都有等级
image_count:图像技术,列表者发布到网站的图片数量
image_urls:图像地址
internet:因特网,该物业是否有互联网接入
landmark:里程碑
latitude:纬度
longitude:经度
occupancy:居住,有多少成人和儿童可以预定该列表
pageurl:页面地址
property_address:属性地址
property_id:属性id
property_name:属性名称
property_type:属性类型,家,酒店,度假村
qts:介绍,爬虫时间
query_time_stamp:查询,时间副本介绍
room_price:房间价格
room_types:房间类型
search_term:搜索词
service_value:服务价值,该属性是否通过验证
similar_hotel:相似酒店,一些类似的名字列表
sitename:网站名称
things_to_do:要做的事,输入者的附近活动
things_to_note:待办事项
业务理解
属性文本描述的有哪些内容,房产在地理上位于哪里
引用调用
无
资源
这家伙很懒,还没有设置简介