百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

使用Python机器学习预测外卖送餐时间!

itomcoil 2025-05-05 16:33 12 浏览

现在的天气是一天比一天热,好多人周末休息在家的时候,就会选择点外卖,毕竟出去一趟又晒又热。


如果你太饿了,点餐太晚了,就可能去关注外卖员送餐到哪了,还有多少时间能送达。


这些信息在美团、饿了吗的App上面都会有显示的。那么这个外卖时间是怎么预测来的呢。


其中有一个办法就是,基于外卖员之前的配送信息,使用机器学习算法来预测外卖的配送时间。


今天小F就给大家来介绍一下,基于Python机器学习预测外卖送餐时间


为了实时预测送餐时间,我们需要计算食物准备点和食物消费点之间的距离。


在找到餐厅和送餐地点之间的距离之后,我们需要找到外卖员过去在相同距离内送餐所花费的时间之间的关系。


这里小F找到了一个数据集,包含了外卖员将食物从餐厅送到送货地点所需时间的数据。


Kaggle上的数据集,包含了这项任务的所有特征,你可以从下面的链接里去下载数据集。


https://www.kaggle.com/datasets/gauravmalik26/food-delivery-dataset



/ 01 /

数据处理


首先导入所需的Python库,读取数据集。


import pandas as pd
import numpy as np
import plotly.express as px

data = pd.read_csv("deliverytime.txt")
print(data.head())

数据集情况如下。


解读一下每个字段的含义~


ID: 订单ID

Delivery_person_ID: 外卖员ID

Delivery_person_Age: 外卖员年龄

Delivery_person_Ratings: 外卖员评分

Restaurant_latitude: 餐厅纬度

Restaurant_longitude: 餐厅经度


Delivery_location_latitude: 配送点纬度


Delivery_location_longitude: 配送点经度

Type_of_order: 点餐类型

Type_of_vehicle: 外卖员车辆类型

Time_taken(min): 外卖员配送花费时间


再看一下每列的信息。


print(data.info())

结果如下,包含每列的名称、数据类型等信息。


看一下这个数据集是否包含空值。


data.isnull().sum()

结果如下,可以看到数据集是没有空值的。


数据集只提供了餐厅和送货地点的经纬度,所以我们需要计算两个经纬度之间的距离。


可以使用半正矢公式(Haversine Formula),根据经纬度计算地球上两点之间的距离。


# 设置地球的半径(千米)
R = 6371


# 将角度转换为弧度
def deg_to_rad(degrees):
    return degrees * (np.pi / 180)


# 使用半正矢公式(Haversine Formula)计算两点之间距离的
def distcalculate(lat1, lon1, lat2, lon2):
    d_lat = deg_to_rad(lat2 - lat1)
    d_lon = deg_to_rad(lon2 - lon1)
    a = np.sin(d_lat / 2) ** 2 + np.cos(deg_to_rad(lat1)) * np.cos(deg_to_rad(lat2)) * np.sin(d_lon / 2) ** 2
    c = 2 * np.arctan2(np.sqrt(a), np.sqrt(1 - a))
    return R * c


# 计算每对点之间的距离
data['distance'] = np.nan

for i in range(len(data)):
    data.loc[i, 'distance'] = distcalculate(data.loc[i, 'Restaurant_latitude'],
                                            data.loc[i, 'Restaurant_longitude'],
                                            data.loc[i, 'Delivery_location_latitude'],
                                            data.loc[i, 'Delivery_location_longitude'])

现在已经计算出了餐厅和送货地点之间的距离。


还在数据集中添加了一个新特征,即distance。


可以再次查看下数据集。


print(data.head())

结果如下。



/ 02 /

关系分析


接下来研究下数据,找出特征之间的关系。


先从运送食物的距离和时间之间的关系开始。


figure = px.scatter(data_frame=data,
                    x="distance",
                    y="Time_taken(min)",
                    size="Time_taken(min)",
                    trendline="ols",
                    title="Relationship Between Distance and Time Taken")
figure.show()

结果如下。


运送食物所花费的时间和距离之间存在固定的关系。


这说明大多数外卖员能够在25-30分钟内送出食物,无论距离远近。


那么外卖时间和外卖员的年龄之间又有什么关系呢?


figure = px.scatter(data_frame=data,
                    x="Delivery_person_Age",
                    y="Time_taken(min)",
                    size="Time_taken(min)",
                    color="distance",
                    trendline="ols",
                    title="Relationship Between Time Taken and Age")
figure.show()

结果如下。



送餐时间与外卖员的年龄呈线性关系。


这意味着年轻的外卖员比年长的外卖员花更少的时间送餐,果然还是年轻好。


送餐时间和外卖员的评分之间的关系。


figure = px.scatter(data_frame=data,
                    x="Delivery_person_Ratings",
                    y="Time_taken(min)",
                    size="Time_taken(min)",
                    color="distance",
                    trendline="ols",
                    title="Relationship Between Time Taken and Ratings")
figure.show()

结果如下。



送餐所花费的时间与外卖员的评分之间存在反比的线性关系。


这意味着与评分低的外卖员相比,评分高的外卖员在送餐上花费的时间更少。


话说谁不希望自己的外卖送快点,点了就想吃。


现在让我们来看看顾客订购的食物类型和外卖员使用的车辆类型是否会影响配送时间。


fig = px.box(data,
             x="Type_of_vehicle",
             y="Time_taken(min)",
             color="Type_of_order")
fig.show()

结果如下。


根据外卖员驾驶的车辆以及他们运送的食物类型,外卖员所花费的时间并没有差太多。


因此,根据分析,对送餐时间影响较大的特征有以下三点。


1. 外卖员的年龄

2. 外卖员的评分

3. 餐厅和送餐地点之间的距离



/ 03 /

模型预测


本次使用LSTM神经网络模型来训练机器学习模型,来完成食品配送时间预测的任务。


# 分类数据集
from sklearn.model_selection import train_test_split
x = np.array(data[["Delivery_person_Age",
                   "Delivery_person_Ratings",
                   "distance"]])
y = np.array(data[["Time_taken(min)"]])
xtrain, xtest, ytrain, ytest = train_test_split(x, y,
                                                test_size=0.10,
                                                random_state=42)

# 创建LSTM神经网络模型
from keras.models import Sequential
from keras.layers import Dense, LSTM
model = Sequential()
model.add(LSTM(128, return_sequences=True, input_shape=(xtrain.shape[1], 1)))
model.add(LSTM(64, return_sequences=False))
model.add(Dense(25))
model.add(Dense(1))
model.summary()

结果如下。


进行训练模型工作。


# 训练模型
model.compile(optimizer='adam', loss='mean_squared_error')
model.fit(xtrain, ytrain, batch_size=1, epochs=9)

结果如下。


模型训练好以后,就可以输入信息,来预测送餐时间。


print("Food Delivery Time Prediction")
a = int(input("Age of Delivery Partner: "))
b = float(input("Ratings of Previous Deliveries: "))
c = int(input("Total Distance: "))

features = np.array([[a, b, c]])
print("Predicted Delivery Time in Minutes = ", model.predict(features))

测验一下,结果如下。


输入信息:外卖员年龄29岁,评分2.9分,距离6km。


得到预测的送餐时间:约42分钟


相关文件及代码都已上传,评论回复【1】即可获取Python资料。

相关推荐

Python Qt GUI设计:将UI文件转换Python文件三种妙招(基础篇—2)

在开始本文之前提醒各位朋友,Python记得安装PyQt5库文件,Python语言功能很强,但是Python自带的GUI开发库Tkinter功能很弱,难以开发出专业的GUI。好在Python语言的开放...

Connect 2.0来了,还有Nuke和Maya新集成

ftrackConnect2.0现在可以下载了--重新设计的桌面应用程序,使用户能够将ftrackStudio与创意应用程序集成,发布资产等。这个新版本的发布中还有两个Nuke和Maya新集成,...

Magicgui:不会GUI编程也能轻松构建Python GUI应用

什么是MagicguiMagicgui是一个Python库,它允许开发者仅凭简单的类型注解就能快速构建图形用户界面(GUI)应用程序。这个库基于Napari项目,利用了Python的强大类型系统,使得...

Python入坑系列:桌面GUI开发之Pyside6

阅读本章之后,你可以掌握这些内容:Pyside6的SignalsandSlots、Envents的作用,如何使用?PySide6的Window、DialogsandAlerts、Widgets...

Python入坑系列-一起认识Pyside6 designer可拖拽桌面GUI

通过本文章,你可以了解一下内容:如何安装和使用Pyside6designerdesigner有哪些的特性通过designer如何转成python代码以前以为Pyside6designer需要在下载...

pyside2的基础界面(pyside2显示图片)

今天我们来学习pyside2的基础界面没有安装过pyside2的小伙伴可以看主页代码效果...

Python GUI开发:打包PySide2应用(python 打包pyc)

之前的文章我们介绍了怎么使用PySide2来开发一个简单PythonGUI应用。这次我们来将上次完成的代码打包。我们使用pyinstaller。注意,pyinstaller默认会将所有安装的pack...

使用PySide2做窗体,到底是怎么个事?看这个能不能搞懂

PySide2是Qt框架的Python绑定,允许你使用Python创建功能强大的跨平台GUI应用程序。PySide2的基本使用方法:安装PySide2pipinstallPy...

pycharm中conda解释器无法配置(pycharm安装的解释器不能用)

之前用的好好的pycharm正常配置解释器突然不能用了?可以显示有这个环境然后确认后可以conda正在配置解释器,但是进度条结束后还是不成功!!试过了pycharm重启,pycharm重装,anaco...

Conda使用指南:从基础操作到Llama-Factory大模型微调环境搭建

Conda虚拟环境在Linux下的全面使用指南:从基础操作到Llama-Factory大模型微调环境搭建在当今的AI开发与数据分析领域,conda虚拟环境已成为Linux系统下管理项目依赖的标配工具。...

Python操作系统资源管理与监控(python调用资源管理器)

在现代计算环境中,对操作系统资源的有效管理和监控是确保应用程序性能和系统稳定性的关键。Python凭借其丰富的标准库和第三方扩展,提供了强大的工具来实现这一目标。本文将探讨Python在操作系统资源管...

本地部署开源版Manus+DeepSeek创建自己的AI智能体

1、下载安装Anaconda,设置conda环境变量,并使用conda创建python3.12虚拟环境。2、从OpenManus仓库下载代码,并安装需要的依赖。3、使用Ollama加载本地DeepSe...

一文教会你,搭建AI模型训练与微调环境,包学会的!

一、硬件要求显卡配置:需要Nvidia显卡,至少配备8G显存,且专用显存与共享显存之和需大于20G。二、环境搭建步骤1.设置文件存储路径非系统盘存储:建议将非安装版的环境文件均存放在非系统盘(如E盘...

使用scikit-learn为PyTorch 模型进行超参数网格搜索

scikit-learn是Python中最好的机器学习库,而PyTorch又为我们构建模型提供了方便的操作,能否将它们的优点整合起来呢?在本文中,我们将介绍如何使用scikit-learn中的网格搜...

如何Keras自动编码器给极端罕见事件分类

全文共7940字,预计学习时长30分钟或更长本文将以一家造纸厂的生产为例,介绍如何使用自动编码器构建罕见事件分类器。现实生活中罕见事件的数据集:背景1.什么是极端罕见事件?在罕见事件问题中,数据集是...