微软开源Playwright-MCP:浏览器自动化的新利器
itomcoil 2025-08-26 17:56 3 浏览
在软件开发和自动化测试领域,浏览器自动化一直是一个热门话题。微软最近开源了一个强大的浏览器自动化工具——Playwright-MCP,它通过模型上下文协议(MCP)为LLMs(大型语言模型)提供了与网页交互的能力,无需依赖截图或视觉调整模型。今天,我们就来深入了解一下这个工具,看看它是如何为开发者带来便利的。
Playwright-MCP简介
Playwright-MCP是一个基于Playwright的MCP服务器,它允许LLMs通过结构化可访问性快照与网页交互。这意味着,开发者可以利用LLMs的强大功能来实现复杂的浏览器自动化任务,而无需担心视觉模型的复杂性和不确定性。
关键特性
- 快速轻量:使用Playwright的无障碍树,而非基于像素的输入,大大提高了性能和可靠性。
- LLM友好:完全基于结构化数据运行,无需视觉模型,使得LLMs能够更高效地处理网页内容。
- 确定性工具应用:避免了截图方法常见的歧义,确保了自动化任务的准确性和一致性。
使用场景
Playwright-MCP适用于多种场景,包括但不限于:
- 网页导航和表单填写:自动完成网页导航和表单填写任务,提高工作效率。
- 结构化内容的数据提取:从网页中提取结构化数据,用于数据分析或其他应用。
- 由LLMs驱动的自动化测试:利用LLMs的强大功能,实现更智能的自动化测试。
- 通用浏览器交互代理:作为一个通用的浏览器交互代理,支持多种浏览器操作。
示例配置
以下是一个基本的Playwright-MCP服务器配置示例:
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": ["@playwright/mcp@latest"]
}
}
}
安装与使用
VS Code中的安装
您可以通过以下方式在VS Code中安装Playwright-MCP服务器:
- 使用VS Code中的安装按钮。
- 使用VS Code CLI安装:
- code --add-mcp '{"name":"playwright","command":"npx","args":["@playwright/mcp@latest"]}'
- 或者,对于VS Code Insiders:
- code-insiders --add-mcp '{"name":"playwright","command":"npx","args":["@playwright/mcp@latest"]}'
安装后,Playwright-MCP服务器将可用于与您的GitHub Copilot代理在VS Code中使用。
用户数据目录
Playwright-MCP将使用新配置文件启动Chrome浏览器,配置文件位于以下位置:
- Windows:%USERPROFILE%\AppData\Local\ms-playwright\mcp-chrome-profile
- macOS:~/Library/Caches/ms-playwright/mcp-chrome-profile
- Linux:~/.cache/ms-playwright/mcp-chrome-profile
所有登录信息都将存储在该配置文件中,您可以在会话之间删除它以清除离线状态。
无GUI浏览器(无头浏览器)
对于后台或批量操作,可以运行无GUI的浏览器:
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": ["@playwright/mcp@latest", "--headless"]
}
}
}
在Linux上运行无DISPLAY的浏览器
当在无显示器的系统上运行带头的浏览器时,可以从具有DISPLAY的环境运行MCP服务器,并通过传递--port标志来启用SSE传输:
npx @playwright/mcp@latest --port 8931
然后在MCP客户端配置中,将url设置为SSE端点:
{
"mcpServers": {
"playwright": {
"url": "http://localhost:8931/sse"
}
}
}
工具模式
Playwright-MCP提供两种模式:
- 快照模式(默认):使用无障碍快照以获得更好的性能和可靠性。
- 视觉模式:使用截图进行基于视觉的交互。
要使用视觉模式,在启动服务器时添加--vision标志:
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": ["@playwright/mcp@latest", "--vision"]
}
}
}
编程使用
您还可以通过编程方式使用Playwright-MCP:
import { createServer } from '@playwright/mcp';
// ...
const server = createServer({ launchOptions: { headless: true } });
transport = new SSEServerTransport("/messages", res);
server.connect(transport);
工具集
Playwright-MCP提供了一套丰富的浏览器自动化工具,包括导航、点击、悬停、拖放、输入文本、选择选项、上传文件、按键操作、捕获快照和截图等。
Playwright-MCP的开源为开发者提供了一个强大的浏览器自动化工具,它不仅轻量级、高性能,还与LLMs无缝集成,极大地简化了自动化任务的实现。无论您是进行自动化测试、数据提取还是其他浏览器自动化任务,Playwright-MCP都值得一试。立即访问Playwright-MCP的GitHub页面,开始探索这个强大的工具吧!您在使用Playwright-MCP时遇到了哪些挑战?欢迎在评论区分享您的经验和见解。
相关推荐
- 编程学子看过来,竞赛刷题网站推荐
-
2022年编程竞赛已经公布,想要在今年取得竞赛成绩的学生,一定要把握寒假时间,学习知识的同时通过刷题,巩固所学知识,提升解题能力。小编为大家推荐几个刷题网站,想要竞赛的学生一定不要错过。USACO美国...
- 给大家推荐些好的c语言代码的网站
-
C语言,那就来推荐几个吧,部分含有C++:1、TheLinuxKernelArchives(kernel.org)Linux内核源码,仅限于C,但内核庞大,不太适合新手;2、redis(redi...
- 推荐几个编程入门学习网站_比较好的编程自学网站
-
有一些刚上大学的朋友和想对编程感兴趣的朋友经常会让我推荐学习网站,下面几个是我认为零基础学编程比较好的网站,希望大家都有收获!1.W3schoolhttp://www.w3school.com.c...
- 10个最值得收藏的编程学习网站_有什么学编程的网站
-
程序员是一个需要不断学习的职业。幸运的是,在这个互联网时代,知识就在那里,等着我们去获取。以下我列举一些免费的编程学习网站包含多个开发语言Java、php、html、javascript等多个。1、h...
- 6个超酷的练习算法,学习编程的网站
-
在不了解算法的前提下,您无法通过Google或Facebook的采访。那么为什么不现在学习。我是一位拥有15年以上经验的程序员。从高中开始的第一年,我在算法上学习和工作很多。在我毕业之前,我一直...
- 在线 python 编程的网站_python3在线编程,python3在线编译器,在线编辑器
-
以下是一些提供在线Python编程环境的网站:1.Repl.it:Repl.it提供了一个多语言在线编程平台,您可以使用它在任何地方编写、运行、共享代码。Repl.it支持多种编程语言,包括Pyth...
- 推荐 7 个能过招全球程序员的编程挑战网站,欢迎挑战!
-
作为程序员的你,是不是经常估不准自己的编程水平?下面推荐7个能过招全球程序员的编程挑战网站,助你磨练技巧,提升技能,最终问鼎代码江湖!1.HackerRank你可以参加各种编码竞赛,比如算法、数学...
- 盘点 20 个编程学习教程网站,建议收藏
-
欢迎关注@程序员柠檬橙私信回复「1024」获取海量编程学习资源!如果你想学习编程,现在互联网这么方便,不用着急报名培训班,有很多高质量的编程学习资源网站可供你学习,程序员日常浏览的技术教程网站有哪些...
- Flask 数据可视化_flourish数据可视化
-
数据可视化是数据处理中的重要部分,前面我们了解了Flask的开发和部署,如何用Flask做数据可视化呢?今天我们来了解一下。Python语言极富表达力,并且拥有众多的数据分析库和框架,是数据...
- 【python 工具】selenium 浏览器操作
-
selenium的安装步骤:1.安装selenium,打开cmd控制台pipinstallselenium2.安装驱动程序(我这里安装的是chromedriver),用来启动chrome浏览器...
- 可视化爬虫工具,EasySpider软件体验
-
现在提起爬虫,大家可能会联想到Python语言,然后就是各种使用无头浏览器去网页上爬取数据,使用Python的过程相较于使用其他语言来说,简单了不少。但毕竟是编程语言,也需要去学习来适配各种网...
- cursor+mcp+playwright,让AI给你推荐五一旅游胜地
-
阅读本文前提当你已了解mcp是什么,若不知,猛击:https://github.com/modelcontextprotocol/servers。最近有个小需求,根据用户输入内容,使用大模型来理解用户...
- Cursor+Claude+Playwright:AI 让自动化测试效率暴涨,快到飞起!
-
一、引言随着AI时代的到来,软件测试变得越来越复杂,如何高效、准确地进行自动化测试成了每一个开发团队必须面对的问题。在日常工作中,测试工作常常面临各种挑战,比如功能复杂、需求频繁变更、时间紧迫等。传统...
- 推荐一个检测 JS 内存泄漏的神器_js内存泄漏的几种情况
-
大家好,我是Echa哥。作为一名Web应用程序开发者,排查和修复JavaScript代码的内存泄漏一直是最困扰我的问题之一。最近,Meta开源了一款检测JavaScript代码内存泄漏...
- Python+Playwright自动化实战:高效爬虫全攻略
-
一、为什么选择Playwright?在信息爆炸的时代,数据获取能力直接决定内容生产效率。Playwright作为微软开源的新型自动化工具,凭借以下优势成为技术创作者的新宠:支持Chromium/Web...
- 一周热门
- 最近发表
- 标签列表
-
- ps图案在哪里 (33)
- super().__init__ (33)
- python 获取日期 (34)
- 0xa (36)
- super().__init__()详解 (33)
- python安装包在哪里找 (33)
- linux查看python版本信息 (35)
- python怎么改成中文 (35)
- php文件怎么在浏览器运行 (33)
- eval在python中的意思 (33)
- python安装opencv库 (35)
- python div (34)
- sticky css (33)
- python中random.randint()函数 (34)
- python去掉字符串中的指定字符 (33)
- python入门经典100题 (34)
- anaconda安装路径 (34)
- yield和return的区别 (33)
- 1到10的阶乘之和是多少 (35)
- python安装sklearn库 (33)
- dom和bom区别 (33)
- js 替换指定位置的字符 (33)
- python判断元素是否存在 (33)
- sorted key (33)
- shutil.copy() (33)