闲鱼APP爬虫
itomcoil 2025-01-15 14:12 8 浏览
写在前面:实现闲鱼APP的特定关键字商品检索
实现思路:首先使用appium驱动app实现数据获取和订单生成,而后通过app抓包分析获取接口
1.appium实现
首先是搭建环境,此前进行工作时,搭建过环境,积累了一定经验,现总结如下
1.1前言知识
参考链接:http://www.testclass.net/appium/appium-base-summary/
appium 是一个自动化测试开源工具,支持 iOS 平台和 Android 平台上的原生应用,web应用和混合应用。
“移动原生应用”是指那些用iOS或者 Android SDK 写的应用(Application简称app)。
“移动web应用”是指使用移动浏览器访问的应用(appium支持iOS上的Safari和Android上的 Chrome)。
“混合应用”是指原生代码封装网页视图——原生代码和 web 内容交互。比如,像 Phonegap,可以帮助开发者使用网页技术开发应用,然后用原生代码封装,这些就是混合应用。
重要的是,appium是一个跨平台的工具:它允许测试人员在不同的平台(iOS,Android)使用同一套API来写自动化测试脚本,这样大大增加了iOS和Android测试套件间代码的复用性。
appium类库封装了标准Selenium客户端类库,为用户提供所有常见的JSON格式selenium命令以及额外的移动设备控制相关的命令,如多点触控手势和屏幕朝向。
appium客户端类库实现了Mobile JSON Wire Protocol(一个标准协议的官方扩展草稿)和W3C WebDriver spec(一个传输不可预知的自动化协议,该协议定义了MultiAction 接口)的元素。
appium服务端定义了官方协议的扩展,为appium 用户提供了方便的接口来执行各种设备动作,例如在测试过程中安装/卸载App。这就是为什么我们需要appium特定的客户端,而不是通用的Selenium 客户端。当然,appium 客户端类库只是增加了一些功能,而实际上这些功能就是简单的扩展了Selenium 客户端,所以他们仍然可以用来运行通用的Selenium会话。
1.2环境配置
1)安装Node.js,直接下载安装即可因为appium是基于node.js实现的,需要提前安装
下载链接如下:https://nodejs.org/zh-cn/
通过node -v 查看版本,确定是否安装成功
2)安装JDK,及配置环境变量
JDK为java开发环境,网上教程较多,可以参考如下链接:
https://blog.csdn.net/qq_38125058/article/details/82890856
3)安装SDK,及配置环境变量
SDK时andriod开发的工具包,是安卓开发必备的,在appium测试中需要使用其中的一些资源程序,并配置环境变量以便调用
参考文章:https://zhuanlan.zhihu.com/p/49193525
下载链接:https://www.androiddevtools.cn/
下载界面如下:
注意下载后打开SDK Mansger.exe并安装资源库,注意安装与android版本一致的API
而后配置ANDROID_HOME环境变量为android-sdk文件夹
并添加
%ANDROID_HOME%\tools
%ANDROID_HOME%\platform-tools
输入adb version测试
4)安装Appium桌面版本
下载链接:http://appium.io/
最新版appium没有appium-doctor程序进行检查,可以通过nodejs下载,进行检查是否配置成功
1.3开始测试
使用python进行测试,首选需要安装python的appium-python-client库
首先打开雷电模拟器,使用adb devices查看是否连接成功
成功后,启动appium,运行python程序
# 导入webdriver
from appium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import time
# 初始化参数
desired_caps = {
'platformName': 'Android', # 被测手机是安卓
'platformVersion': '5.1.1', # 手机安卓版本
'deviceName': 'emulator-5554', # 设备名,安卓手机可以随意填写
'appPackage': 'com.taobao.idlefish', # 启动APP Package名称
'appActivity': 'com.taobao.fleamarket.home.activity.MainActivity', # 启动Activity名称
'noReset': True, # 不要重置App,如果为False的话,执行完脚本后,app的数据会清空,比如你原本登录了,执行完脚本后就退出登录了
}
# 连接Appium Server,初始化自动化环境
driver = webdriver.Remote('http://localhost:4723/wd/hub', desired_caps)
wait = WebDriverWait(driver, 30)
search_entry = wait.until(EC.presence_of_element_located((By.ID, 'com.taobao.idlefish:id/search_bar_layout')))
search_entry.click()
search_name = wait.until(EC.presence_of_element_located((By.CLASS_NAME, 'android.widget.EditText')))
search_name.set_text('redmik30')
search_button = wait.until(EC.presence_of_element_located((By.XPATH, "//*[@text='搜索']")))
search_button.click()
wait.until(EC.presence_of_element_located((By.CLASS_NAME, "android.widget.ScrollView")))
# time.sleep(10)
while True:
driver.swipe(500, 1900, 500, 300, 300)
items = wait.until(EC.presence_of_all_elements_located((By.XPATH, "//*[@class='android.widget.ScrollView']/android.view.View")))
for item in items:
print(item)
由于前期没有android基础,对于desired_caps参数不了解,走了很多弯路
appPackage和appActivity通过adb命令可查看
通过命令:adb shell dumpsys window w |findstr \/ |findstr name=查看相关属性
2.APP抓包分析
2.1使用代理抓包
通过fildder代理抓包,开始fildder后,在雷电模拟器设置系统代理
经测试浏览器流量成功被代理、但app流量代理失效
经过查阅资料治app自动忽略系统代理,通过下载全局代理软件proxyDroid实现全局代理,进而绕过
下载链接如下:https://download.csdn.net/download/weixin_43906500/16634072
成功获取数据包
2.2分析接口
查看请求,发现闲鱼搜索请求参数存在加密,难以分析,如果要进行后续分析需要学习安卓逆向知识,进行源码分析
————————————————
版权声明:本文为CSDN博主「金鳞本鲤」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_43906500/article/details/115623201
相关推荐
- MySql安装与使用
-
介绍mysql是目前最流行的关系型数据库管理系统,在WEB应用方面MySQL是最好的RDBMS(RelationalDatabaseManagementSystem:关系数据库管理系统)应用软件...
- 使用AI来搭建一个用户系统,步骤应该是怎样的呢?
-
我给AI的第一个问题是这样的:创建一个java21+springboot3.4+mysql21的一个用户系统,需要使用JWT,支持多语言,使用swagger,这个用户系统都应该包含哪...
- Mysql 8.4数据库安装、新建用户和数据库、表单
-
1、下载MySQL数据库yuminstall-ywgetperlnet-toolslibtirpc#安装wget和perl、net-tools、libtirpcwgethtt...
- 介绍如何在 MySQL 中创建新用户并授予权限?
-
MySQL是一个开源的关系型数据库管理系统,常用于存储和管理大量的结构化数据。在使用MySQL进行数据管理时,为了安全和方便管理,通常需要创建新用户并授予相应的权限。本文将介绍如何在MySQL...
- Mysql创建用户和权限管理
-
MySQL是一个多用户的数据库,最高权限管理者是root用户,它拥有着最高的权限操作。包括select、update、delete、update、grant等操作。如果有其他用户想使用MySQL,那么...
- Mysql:创建用户详解
-
1、创建并授权用户--创建可从任何主机连接的用户CREATEUSER'myuser'@'%'IDENTIFIEDBY'mypassword'...
- Python 实现【字符匹配】
-
defis_match(s,pattern):m,n=len(s),len(pattern)dp=[[False]*(n+1)for_inrange...
- Python自动化:openpyxl工作簿、工作表相关操作
-
新建工作簿、工作表importopenpyxl#创建空白工作簿,会自动生成一个工作表:Sheetwb=openpyxl.Workbook()#新建工作表#create_sheet...
- python每日一练之三数排序
-
概述今天主要分享一个三树排序的实例,大家可以自己测试玩一下~需求输入三个整数x,y,z,请把这三个数由小到大输出。方法一:如果是要练练手就随便找个排序算法实现一下#usr/bin/python#...
- Python输出语句print()
-
Python中的输出语句主要通过内置函数print()实现,它可以灵活输出文本、变量、表达式结果等内容到控制台或其他文件。以下是详细介绍及示例:一、print()基本语法print(*object...
- Python设置excel表格格式,这3个属性6个模块,要表格好看
-
前言:通过前面两篇文章,我们用Python处理excel数据得到了结果并保存了文件。打开文件会发现,文件里表格是没有设置格式的,还需手动调整行高列宽等样式,很麻烦。其实,通过Python库模块,能轻松...
- python入门-day5-循环语句
-
以下是为“Day5:循环语句”设计的详细学习任务计划。这个任务旨在帮助初学者掌握Python中的循环语句(for和while),并通过实践理解它们的应用场景。Day5:循环语句学习目标...
- Python基础编程必备!涵盖常见语法与操作的代码示例合集
-
以下是一份Python基础代码示例合集,涵盖了常见的语法和操作,适合初学者快速掌握基本编程概念:1.基础语法python#打印输出print("Hello,World!")#变...
- Python循环语句实用教程
-
一、循环基础1.while循环基本语法:while条件表达式:循环体代码while循环流程图:应用示例:#简单计数器count=0whilecount<5:...
- 在 Python 中如何向一个已排序的数组(列表) 中插入一个数呢
-
在Python中如何向一个已排序的数组(列表)中插入一个数呢?方法有很多种,关键在于原来数组是什么样的排序,用到啥排序方法效率高,就用哪种。我们来练习其中的几种插入方法,另外也掌握下遍历数组的...
- 一周热门
- 最近发表
- 标签列表
-
- ps图案在哪里 (33)
- super().__init__ (33)
- python 获取日期 (34)
- 0xa (36)
- super().__init__()详解 (33)
- python安装包在哪里找 (33)
- linux查看python版本信息 (35)
- python怎么改成中文 (35)
- php文件怎么在浏览器运行 (33)
- eval在python中的意思 (33)
- python安装opencv库 (35)
- python div (34)
- sticky css (33)
- python中random.randint()函数 (34)
- python去掉字符串中的指定字符 (33)
- python入门经典100题 (34)
- anaconda安装路径 (34)
- yield和return的区别 (33)
- 1到10的阶乘之和是多少 (35)
- python安装sklearn库 (33)
- dom和bom区别 (33)
- js 替换指定位置的字符 (33)
- python判断元素是否存在 (33)
- sorted key (33)
- shutil.copy() (33)