使用Python机器学习预测外卖送餐时间!
itomcoil 2025-05-05 16:33 5 浏览
现在的天气是一天比一天热,好多人周末休息在家的时候,就会选择点外卖,毕竟出去一趟又晒又热。
如果你太饿了,点餐太晚了,就可能去关注外卖员送餐到哪了,还有多少时间能送达。
这些信息在美团、饿了吗的App上面都会有显示的。那么这个外卖时间是怎么预测来的呢。
其中有一个办法就是,基于外卖员之前的配送信息,使用机器学习算法来预测外卖的配送时间。
今天小F就给大家来介绍一下,基于Python机器学习预测外卖送餐时间。
为了实时预测送餐时间,我们需要计算食物准备点和食物消费点之间的距离。
在找到餐厅和送餐地点之间的距离之后,我们需要找到外卖员过去在相同距离内送餐所花费的时间之间的关系。
这里小F找到了一个数据集,包含了外卖员将食物从餐厅送到送货地点所需时间的数据。
是Kaggle上的数据集,包含了这项任务的所有特征,你可以从下面的链接里去下载数据集。
https://www.kaggle.com/datasets/gauravmalik26/food-delivery-dataset
/ 01 /
数据处理
首先导入所需的Python库,读取数据集。
import pandas as pd
import numpy as np
import plotly.express as px
data = pd.read_csv("deliverytime.txt")
print(data.head())
数据集情况如下。
解读一下每个字段的含义~
ID: 订单ID
Delivery_person_ID: 外卖员ID
Delivery_person_Age: 外卖员年龄
Delivery_person_Ratings: 外卖员评分
Restaurant_latitude: 餐厅纬度
Restaurant_longitude: 餐厅经度
Delivery_location_latitude: 配送点纬度
Delivery_location_longitude: 配送点经度
Type_of_order: 点餐类型
Type_of_vehicle: 外卖员车辆类型
Time_taken(min): 外卖员配送花费时间
再看一下每列的信息。
print(data.info())
结果如下,包含每列的名称、数据类型等信息。
看一下这个数据集是否包含空值。
data.isnull().sum()
结果如下,可以看到数据集是没有空值的。
数据集只提供了餐厅和送货地点的经纬度,所以我们需要计算两个经纬度之间的距离。
可以使用半正矢公式(Haversine Formula),根据经纬度计算地球上两点之间的距离。
# 设置地球的半径(千米)
R = 6371
# 将角度转换为弧度
def deg_to_rad(degrees):
return degrees * (np.pi / 180)
# 使用半正矢公式(Haversine Formula)计算两点之间距离的
def distcalculate(lat1, lon1, lat2, lon2):
d_lat = deg_to_rad(lat2 - lat1)
d_lon = deg_to_rad(lon2 - lon1)
a = np.sin(d_lat / 2) ** 2 + np.cos(deg_to_rad(lat1)) * np.cos(deg_to_rad(lat2)) * np.sin(d_lon / 2) ** 2
c = 2 * np.arctan2(np.sqrt(a), np.sqrt(1 - a))
return R * c
# 计算每对点之间的距离
data['distance'] = np.nan
for i in range(len(data)):
data.loc[i, 'distance'] = distcalculate(data.loc[i, 'Restaurant_latitude'],
data.loc[i, 'Restaurant_longitude'],
data.loc[i, 'Delivery_location_latitude'],
data.loc[i, 'Delivery_location_longitude'])
现在已经计算出了餐厅和送货地点之间的距离。
还在数据集中添加了一个新特征,即distance。
可以再次查看下数据集。
print(data.head())
结果如下。
/ 02 /
关系分析
接下来研究下数据,找出特征之间的关系。
先从运送食物的距离和时间之间的关系开始。
figure = px.scatter(data_frame=data,
x="distance",
y="Time_taken(min)",
size="Time_taken(min)",
trendline="ols",
title="Relationship Between Distance and Time Taken")
figure.show()
结果如下。
运送食物所花费的时间和距离之间存在固定的关系。
这说明大多数外卖员能够在25-30分钟内送出食物,无论距离远近。
那么外卖时间和外卖员的年龄之间又有什么关系呢?
figure = px.scatter(data_frame=data,
x="Delivery_person_Age",
y="Time_taken(min)",
size="Time_taken(min)",
color="distance",
trendline="ols",
title="Relationship Between Time Taken and Age")
figure.show()
结果如下。
送餐时间与外卖员的年龄呈线性关系。
这意味着年轻的外卖员比年长的外卖员花更少的时间送餐,果然还是年轻好。
送餐时间和外卖员的评分之间的关系。
figure = px.scatter(data_frame=data,
x="Delivery_person_Ratings",
y="Time_taken(min)",
size="Time_taken(min)",
color="distance",
trendline="ols",
title="Relationship Between Time Taken and Ratings")
figure.show()
结果如下。
送餐所花费的时间与外卖员的评分之间存在反比的线性关系。
这意味着与评分低的外卖员相比,评分高的外卖员在送餐上花费的时间更少。
话说谁不希望自己的外卖送快点,点了就想吃。
现在让我们来看看顾客订购的食物类型和外卖员使用的车辆类型是否会影响配送时间。
fig = px.box(data,
x="Type_of_vehicle",
y="Time_taken(min)",
color="Type_of_order")
fig.show()
结果如下。
根据外卖员驾驶的车辆以及他们运送的食物类型,外卖员所花费的时间并没有差太多。
因此,根据分析,对送餐时间影响较大的特征有以下三点。
1. 外卖员的年龄
2. 外卖员的评分
3. 餐厅和送餐地点之间的距离
/ 03 /
模型预测
本次使用LSTM神经网络模型来训练机器学习模型,来完成食品配送时间预测的任务。
# 分类数据集
from sklearn.model_selection import train_test_split
x = np.array(data[["Delivery_person_Age",
"Delivery_person_Ratings",
"distance"]])
y = np.array(data[["Time_taken(min)"]])
xtrain, xtest, ytrain, ytest = train_test_split(x, y,
test_size=0.10,
random_state=42)
# 创建LSTM神经网络模型
from keras.models import Sequential
from keras.layers import Dense, LSTM
model = Sequential()
model.add(LSTM(128, return_sequences=True, input_shape=(xtrain.shape[1], 1)))
model.add(LSTM(64, return_sequences=False))
model.add(Dense(25))
model.add(Dense(1))
model.summary()
结果如下。
进行训练模型工作。
# 训练模型
model.compile(optimizer='adam', loss='mean_squared_error')
model.fit(xtrain, ytrain, batch_size=1, epochs=9)
结果如下。
模型训练好以后,就可以输入信息,来预测送餐时间。
print("Food Delivery Time Prediction")
a = int(input("Age of Delivery Partner: "))
b = float(input("Ratings of Previous Deliveries: "))
c = int(input("Total Distance: "))
features = np.array([[a, b, c]])
print("Predicted Delivery Time in Minutes = ", model.predict(features))
测验一下,结果如下。
输入信息:外卖员年龄29岁,评分2.9分,距离6km。
得到预测的送餐时间:约42分钟
相关文件及代码都已上传,评论回复【1】即可获取Python资料。
相关推荐
- Python办公自动化系列篇之一:电子表格自动化(EXCEL)
-
作为高效办公自动化领域的主流编程语言,Python凭借其优雅的语法结构、完善的技术生态及成熟的第三方工具库集合,已成为企业数字化转型过程中提升运营效率的理想选择。该语言在结构化数据处理、自动化文档生成...
- Python解决读取excel数据慢的问题
-
前言:在做自动化测试的时候,我思考了一个问题,就是如果我们的测试用例随着项目的推进越来越多时,我们做自动化回归的时间也就越来越长,其中影响自动化测试速度的一个原因就是测试用例的读取问题。用例越多,所消...
- Python高效办公:用自动化脚本批量处理Excel
-
在现代办公环境中,Excel是处理数据的必备工具,但手动操作往往耗时且容易出错。幸运的是,Python提供了强大的库,如`openpyxl`和`pandas`,能够帮助我们高效地自动化处理Exc...
- 【第三弹】用Python实现Excel的vlookup功能
-
今天继续用pandas实现Excel的vlookup功能,假设我们的2个表长成这样:我们希望把Sheet2的部门匹在Sheet1的最后一列。话不多说,先上代码:importpandasaspd...
- 学习Pandas中操作Excel,看这一篇文章就够了
-
在数据分析和处理领域,Excel文件是常见的数据存储格式之一。Pandas库提供了强大的功能来读取、处理和写入Excel文件。本文将详细介绍如何使用Pandas操作Excel文件,包括读取、数据清洗、...
- python学习笔记之pandas读取excel出现的列表显示不全问题
-
今天小编想改正一个表格,按照之前学习的首先导入模块importpandas读取目标excel文件data=pandas.read_excel("C:\\Users\\27195\\Des...
- 使用Python玩转Excel(python-excel)
-
Python读取Excel文件的方法主要有以下几种:Pandas库:Pandas是一个强大的数据处理库,它提供了方便的方法来读取和处理Excel文件。优点:Pandas是一个非常强大的数...
- Python和Excel已经互通了,还不赶紧来学习一下
-
Excel是数据分析中最常用的工具,这篇文章将Python与Excel的功能对比介绍如何使用Python通过函数式编程完成Excel中的数据处理及分析工作。在Python中pandas库用于数据处理,...
- python读excel文件最佳实践?直接请教pandas比gpt还好用
-
前言说到python读取excel文件,网上使用openpyxl的文章一大堆。我自己很少直接使用openpyxl,一般使用pandas间接使用。但如果你不希望引入pandas,该如...
- 用python实现execl表格内容的数据分析与处理
-
可以使用Python中的pandas库来处理Excel表格数据。以下是一个简单的例子:首先,安装pandas库:```pipinstallpandas```然后,读取Excel文件:```impo...
- 从入门到精通:Python处理Excel文件的实用技巧
-
在数据分析和处理的过程中,Excel是一种广泛使用的数据存储和交换格式。Python提供了多个强大的库来处理Excel文件,如pandas、openpyxl和xlrd等。本文将详细介绍...
- Python自动化-Excel:pandas之concat
-
concatimportpandasaspds1=pd.Series([0,1,2],index=['A','B','C'])s2=p...
- Python之Pandas使用系列(八):读写Excel文件的各种技巧
-
介绍:我们将学习如何使用Python操作Excel文件。我们将概述如何使用Pandas加载xlsx文件以及将电子表格写入Excel。如何将Excel文件读取到PandasDataFrame:和前面的...
- Python操作Excel详细教程,值得收藏
-
Python操作Excel是一个非常强大的工具,它可以方便地处理Excel文件,例如读取、写入、格式化单元格等。以下是使用Python操作Excel的详细教程,以Excel文件名为example.xl...
- python中pandas读取excel单列及连续多列数据
-
案例:想获取test.xls中C列、H列以后(当H列后列数未知时)的所有数据。importpandasaspdfile_name=r'D:\test.xls'#表格绝对...
- 一周热门
- 最近发表
- 标签列表
-
- ps像素和厘米换算 (32)
- ps图案在哪里 (33)
- super().__init__ (33)
- python 获取日期 (34)
- 0xa (36)
- super().__init__()详解 (33)
- python安装包在哪里找 (33)
- linux查看python版本信息 (35)
- python怎么改成中文 (35)
- php文件怎么在浏览器运行 (33)
- eval在python中的意思 (33)
- python安装opencv库 (35)
- python div (34)
- sticky css (33)
- python中random.randint()函数 (34)
- python去掉字符串中的指定字符 (33)
- python入门经典100题 (34)
- anaconda安装路径 (34)
- yield和return的区别 (33)
- 1到10的阶乘之和是多少 (35)
- python安装sklearn库 (33)
- dom和bom区别 (33)
- js 替换指定位置的字符 (33)
- python判断元素是否存在 (33)
- sorted key (33)