百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

使用Python机器学习预测外卖送餐时间!

itomcoil 2025-05-05 16:33 19 浏览

现在的天气是一天比一天热,好多人周末休息在家的时候,就会选择点外卖,毕竟出去一趟又晒又热。


如果你太饿了,点餐太晚了,就可能去关注外卖员送餐到哪了,还有多少时间能送达。


这些信息在美团、饿了吗的App上面都会有显示的。那么这个外卖时间是怎么预测来的呢。


其中有一个办法就是,基于外卖员之前的配送信息,使用机器学习算法来预测外卖的配送时间。


今天小F就给大家来介绍一下,基于Python机器学习预测外卖送餐时间


为了实时预测送餐时间,我们需要计算食物准备点和食物消费点之间的距离。


在找到餐厅和送餐地点之间的距离之后,我们需要找到外卖员过去在相同距离内送餐所花费的时间之间的关系。


这里小F找到了一个数据集,包含了外卖员将食物从餐厅送到送货地点所需时间的数据。


Kaggle上的数据集,包含了这项任务的所有特征,你可以从下面的链接里去下载数据集。


https://www.kaggle.com/datasets/gauravmalik26/food-delivery-dataset



/ 01 /

数据处理


首先导入所需的Python库,读取数据集。


import pandas as pd
import numpy as np
import plotly.express as px

data = pd.read_csv("deliverytime.txt")
print(data.head())

数据集情况如下。


解读一下每个字段的含义~


ID: 订单ID

Delivery_person_ID: 外卖员ID

Delivery_person_Age: 外卖员年龄

Delivery_person_Ratings: 外卖员评分

Restaurant_latitude: 餐厅纬度

Restaurant_longitude: 餐厅经度


Delivery_location_latitude: 配送点纬度


Delivery_location_longitude: 配送点经度

Type_of_order: 点餐类型

Type_of_vehicle: 外卖员车辆类型

Time_taken(min): 外卖员配送花费时间


再看一下每列的信息。


print(data.info())

结果如下,包含每列的名称、数据类型等信息。


看一下这个数据集是否包含空值。


data.isnull().sum()

结果如下,可以看到数据集是没有空值的。


数据集只提供了餐厅和送货地点的经纬度,所以我们需要计算两个经纬度之间的距离。


可以使用半正矢公式(Haversine Formula),根据经纬度计算地球上两点之间的距离。


# 设置地球的半径(千米)
R = 6371


# 将角度转换为弧度
def deg_to_rad(degrees):
    return degrees * (np.pi / 180)


# 使用半正矢公式(Haversine Formula)计算两点之间距离的
def distcalculate(lat1, lon1, lat2, lon2):
    d_lat = deg_to_rad(lat2 - lat1)
    d_lon = deg_to_rad(lon2 - lon1)
    a = np.sin(d_lat / 2) ** 2 + np.cos(deg_to_rad(lat1)) * np.cos(deg_to_rad(lat2)) * np.sin(d_lon / 2) ** 2
    c = 2 * np.arctan2(np.sqrt(a), np.sqrt(1 - a))
    return R * c


# 计算每对点之间的距离
data['distance'] = np.nan

for i in range(len(data)):
    data.loc[i, 'distance'] = distcalculate(data.loc[i, 'Restaurant_latitude'],
                                            data.loc[i, 'Restaurant_longitude'],
                                            data.loc[i, 'Delivery_location_latitude'],
                                            data.loc[i, 'Delivery_location_longitude'])

现在已经计算出了餐厅和送货地点之间的距离。


还在数据集中添加了一个新特征,即distance。


可以再次查看下数据集。


print(data.head())

结果如下。



/ 02 /

关系分析


接下来研究下数据,找出特征之间的关系。


先从运送食物的距离和时间之间的关系开始。


figure = px.scatter(data_frame=data,
                    x="distance",
                    y="Time_taken(min)",
                    size="Time_taken(min)",
                    trendline="ols",
                    title="Relationship Between Distance and Time Taken")
figure.show()

结果如下。


运送食物所花费的时间和距离之间存在固定的关系。


这说明大多数外卖员能够在25-30分钟内送出食物,无论距离远近。


那么外卖时间和外卖员的年龄之间又有什么关系呢?


figure = px.scatter(data_frame=data,
                    x="Delivery_person_Age",
                    y="Time_taken(min)",
                    size="Time_taken(min)",
                    color="distance",
                    trendline="ols",
                    title="Relationship Between Time Taken and Age")
figure.show()

结果如下。



送餐时间与外卖员的年龄呈线性关系。


这意味着年轻的外卖员比年长的外卖员花更少的时间送餐,果然还是年轻好。


送餐时间和外卖员的评分之间的关系。


figure = px.scatter(data_frame=data,
                    x="Delivery_person_Ratings",
                    y="Time_taken(min)",
                    size="Time_taken(min)",
                    color="distance",
                    trendline="ols",
                    title="Relationship Between Time Taken and Ratings")
figure.show()

结果如下。



送餐所花费的时间与外卖员的评分之间存在反比的线性关系。


这意味着与评分低的外卖员相比,评分高的外卖员在送餐上花费的时间更少。


话说谁不希望自己的外卖送快点,点了就想吃。


现在让我们来看看顾客订购的食物类型和外卖员使用的车辆类型是否会影响配送时间。


fig = px.box(data,
             x="Type_of_vehicle",
             y="Time_taken(min)",
             color="Type_of_order")
fig.show()

结果如下。


根据外卖员驾驶的车辆以及他们运送的食物类型,外卖员所花费的时间并没有差太多。


因此,根据分析,对送餐时间影响较大的特征有以下三点。


1. 外卖员的年龄

2. 外卖员的评分

3. 餐厅和送餐地点之间的距离



/ 03 /

模型预测


本次使用LSTM神经网络模型来训练机器学习模型,来完成食品配送时间预测的任务。


# 分类数据集
from sklearn.model_selection import train_test_split
x = np.array(data[["Delivery_person_Age",
                   "Delivery_person_Ratings",
                   "distance"]])
y = np.array(data[["Time_taken(min)"]])
xtrain, xtest, ytrain, ytest = train_test_split(x, y,
                                                test_size=0.10,
                                                random_state=42)

# 创建LSTM神经网络模型
from keras.models import Sequential
from keras.layers import Dense, LSTM
model = Sequential()
model.add(LSTM(128, return_sequences=True, input_shape=(xtrain.shape[1], 1)))
model.add(LSTM(64, return_sequences=False))
model.add(Dense(25))
model.add(Dense(1))
model.summary()

结果如下。


进行训练模型工作。


# 训练模型
model.compile(optimizer='adam', loss='mean_squared_error')
model.fit(xtrain, ytrain, batch_size=1, epochs=9)

结果如下。


模型训练好以后,就可以输入信息,来预测送餐时间。


print("Food Delivery Time Prediction")
a = int(input("Age of Delivery Partner: "))
b = float(input("Ratings of Previous Deliveries: "))
c = int(input("Total Distance: "))

features = np.array([[a, b, c]])
print("Predicted Delivery Time in Minutes = ", model.predict(features))

测验一下,结果如下。


输入信息:外卖员年龄29岁,评分2.9分,距离6km。


得到预测的送餐时间:约42分钟


相关文件及代码都已上传,评论回复【1】即可获取Python资料。

相关推荐

selenium(WEB自动化工具)

定义解释Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7,8,9,10,11),MozillaF...

开发利器丨如何使用ELK设计微服务中的日志收集方案?

【摘要】微服务各个组件的相关实践会涉及到工具,本文将会介绍微服务日常开发的一些利器,这些工具帮助我们构建更加健壮的微服务系统,并帮助排查解决微服务系统中的问题与性能瓶颈等。我们将重点介绍微服务架构中...

高并发系统设计:应对每秒数万QPS的架构策略

当面试官问及"如何应对每秒几万QPS(QueriesPerSecond)"时,大概率是想知道你对高并发系统设计的理解有多少。本文将深入探讨从基础设施到应用层面的解决方案。01、理解...

2025 年每个 JavaScript 开发者都应该了解的功能

大家好,很高兴又见面了,我是"高级前端进阶",由我带着大家一起关注前端前沿、深入前端底层技术,大家一起进步,也欢迎大家关注、点赞、收藏、转发。1.Iteratorhelpers开发者...

JavaScript Array 对象

Array对象Array对象用于在变量中存储多个值:varcars=["Saab","Volvo","BMW"];第一个数组元素的索引值为0,第二个索引值为1,以此类推。更多有...

Gemini 2.5编程全球霸榜,谷歌重回AI王座,神秘模型曝光,奥特曼迎战

刚刚,Gemini2.5Pro编程登顶,6美元性价比碾压Claude3.7Sonnet。不仅如此,谷歌还暗藏着更强的编程模型Dragontail,这次是要彻底翻盘了。谷歌,彻底打了一场漂亮的翻...

动力节点最新JavaScript教程(高级篇),深入学习JavaScript

JavaScript是一种运行在浏览器中的解释型编程语言,它的解释器被称为JavaScript引擎,是浏览器的一部分,JavaScript广泛用于浏览器客户端编程,通常JavaScript脚本是通过嵌...

一文看懂Kiro,其 Spec工作流秒杀Cursor,可移植至Claude Code

当Cursor的“即兴编程”开始拖累项目质量,AWS新晋IDEKiro以Spec工作流打出“先规范后编码”的系统工程思维:需求-设计-任务三件套一次生成,文档与代码同步落地,复杂项目不...

「晚安·好梦」努力只能及格,拼命才能优秀

欢迎光临,浏览之前点击上面的音乐放松一下心情吧!喜欢的话给小编一个关注呀!Effortscanonlypass,anddesperatelycanbeexcellent.努力只能及格...

JavaScript 中 some 与 every 方法的区别是什么?

大家好,很高兴又见面了,我是姜茶的编程笔记,我们一起学习前端相关领域技术,共同进步,也欢迎大家关注、点赞、收藏、转发,您的支持是我不断创作的动力在JavaScript中,Array.protot...

10个高效的Python爬虫框架,你用过几个?

小型爬虫需求,requests库+bs4库就能解决;大型爬虫数据,尤其涉及异步抓取、内容管理及后续扩展等功能时,就需要用到爬虫框架了。下面介绍了10个爬虫框架,大家可以学习使用!1.Scrapysc...

12个高效的Python爬虫框架,你用过几个?

实现爬虫技术的编程环境有很多种,Java、Python、C++等都可以用来爬虫。但很多人选择Python来写爬虫,为什么呢?因为Python确实很适合做爬虫,丰富的第三方库十分强大,简单几行代码便可实...

pip3 install pyspider报错问题解决

运行如下命令报错:>>>pip3installpyspider观察上面的报错问题,需要安装pycurl。是到这个网址:http://www.lfd.uci.edu/~gohlke...

PySpider框架的使用

PysiderPysider是一个国人用Python编写的、带有强大的WebUI的网络爬虫系统,它支持多种数据库、任务监控、项目管理、结果查看、URL去重等强大的功能。安装pip3inst...

「机器学习」神经网络的激活函数、并通过python实现激活函数

神经网络的激活函数、并通过python实现whatis激活函数感知机的网络结构如下:左图中,偏置b没有被画出来,如果要表示出b,可以像右图那样做。用数学式来表示感知机:上面这个数学式子可以被改写:...