百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

斩获 3.4k+ Star 的 C++ Insights:用编译器的视角看源码!

itomcoil 2024-12-29 03:54 26 浏览

近日,在新闻平台 HackerNews 上有个开发者颇为关注的 GitHub 项目,名叫 C++ Insights,特色就是:用编译器的眼睛看源码。为此,项目作者对其进行了详细介绍。

文链接:https://github.com/andreasfertig/cppinsights

作者 | Andreas Fertig
翻译 | 郑丽媛
出品 | 程序人生(ID:coder_life)

C++ Insights 是什么?


C++ Insights 是一种基于 Clang 的工具,可进行源码到源码的转换,其目标是揭示通常情况下编译器在幕后为我们做的工作。它能帮我们看到编译器为了让代码正常运行而进行的一些神奇操作。

以下面这段代码为例:

class Base {};
class Derived : public Base {};
int main() { Derived d;
Derived d2 = d;
d2 = d;
Base& b = d;}

没有什么特别之处,当然也能编译。下面是编译器对它的看法:

class Base{ public: // inline constexpr Base() noexcept = default; // inline constexpr Base(const Base &) noexcept = default; // inline constexpr Base & operator=(const Base &) noexcept = default;};


class Derived : public Base{ public: // inline constexpr Derived() noexcept = default; // inline constexpr Derived(const Derived &) noexcept = default; // inline constexpr Derived & operator=(const Derived &) noexcept = default;};
int main(){ Derived d; Derived d2 = Derived(d); d2.operator=(d); Base & b = static_cast<Base&>(d); return 0;}

你可以看到所有由编译器提供的特殊成员函数,以及从 Derived 向 Base 的向上转型。


为什么要做 C++ Insights?


2017 年,我开始研究 C++11、C++14 和 C++17 带来的一些新特性,如 lambda 表达式、基于范围的 for 循环和结构化绑定等。然而,所有这些研究以及我的一些培训和教学经历让我开始思考:如果我们能以编译器的视角来洞悉代码,那将会是怎样一番景象?当然,至少对于 Clang 来说,是有 AST(抽象语法树)转储功能的,我们可以用 Compiler Explorer 等工具查看编译器从 C++ 源代码片段生成的代码。不过,我们看到的是汇编程序,AST 和 Compiler Explorer 的输出并不是我写代码的语言,因此我对这些输出并不熟悉。另外,在教学生 C++ 时,如果跟他们展示 AST 并解释说这就是全部内容,我自己感觉也不太满意。

于是,我开始着手编写一个基于 Clang 的工具,可将基于范围的 for 循环转换为编译器内部版本。接着,我对结构化绑定和 lambda 也做了同样的处理。最终,我的工作超出了最初计划。

C++ Insights 这个工具显示了运算符的调用位置,以及编译器进行类型转换的情况,可以推断出 auto 或 decltype 背后的类型。我的目标是生成可编译的代码,然而,并非所有情况都能实现这一点。

例如,你可以看到 lambda、基于范围的 for 循环或 auto 的转换。当然,你也可以转换任何其他 C++ 代码段。

感兴趣的话,你可以亲自试试看。C++ Insights 在线使用网址:https://cppinsights.io/

不过,还有很多工作要做。我不敢说我做的一切都是正确的,目前我还在努力支持 C++20 等新标准的特性。请记住,C++ Insights 是基于 Clang 及其对 AST 的理解而建立的。


如何构建?


C++ Insights 可以在 Clang 源代码树内部或外部进行构建。

(1)在 Windows 上构建

已测试(支持的编译器)

注意:仅支持在 LLVM 外部构建。不支持 x86,因为没有针对 x86 的 LLVM/Clang 库。

对于带有 VS 的 Clang:

  • 前往 LLVM 下载页面;

  • 从“Pre-Built Binaries”部分安装“Windows(64位)”;

安装程序会自动将 LLVM 工具集添加到你所有 Visual Studio 实例中。

从源代码构建和安装 Clang

需要有 Clang 库和 llvm-config.exe 来设置 CMake。

将 Clang/LLVM 库安装到(例如)C:\Programs\LLVM_local2。

注意:

  • 安装路径中不能有空格;

  • 最好不要使用 %Program Files%,否则需要管理员权限来安装文件。

git clone https://github.com/llvm/llvm-project.gitcd llvm-projectmkdir buildcd buildcmake -DLLVM_ENABLE_PROJECTS=clang ^ -DCMAKE_INSTALL_PREFIX=C:\Programs\LLVM_local2 ^ -G "Visual Studio 15 2017" ^ -A x64 ^ -Thost=x64 ^ ..\llvmcmake --build . --config Release --target install

你也可以在 Visual Studio 中打开 build/LLVM.sln 解决方案,然后在其中构建所有内容,而不是使用 cmake --build ... 命令。

构建 Insights

假设:

  • C++ Insights 源代码位于 C:\dev\cppinsights,并且

  • LLVM/Clang 已经构建并安装到 C:\Programs\LLVM_local2(参见上面的步骤)

cd C:\dev\cppinsights\mkdir buildcd buildset path=%path%;C:\Programs\LLVM_local2\bincmake -G "Visual Studio 16 2019" -A x64 -T LLVM_v142 ..cmake --build . --config Release --target insights

除了带“Visual Studio 16 2019”的 Clang,你还可以选择其他适合你的。具体可参见上面的 “已测试(支持的编译器)”,查看 CMake 命令列。另外,你也可以直接在 Visual Studio 中打开 build/cpp-insights.sln 文件进行构建,而不必通过命令行。

(2)在 Arch Linux 上构建

要使用 extra/clang 构建,请使用以下额外标记:

-DINSIGHTS_USE_SYSTEM_INCLUDES=off -DCLANG_LINK_CLANG_DYLIB=on -DLLVM_LINK_LLVM_DYLIB=on

extra/clang 和 extra/llvm 提供 /usr/lib/{libclangAST.so,libLLVM*.a,libLLVM.so},libclangAST.so 需要 libLLVM.so,如果链接的是 libLLVM*.a(而不是 libLLVM.so),就会发生冲突。

(3)在 Clang 外部构建

你需要在搜索路径中安装 Clang。

git clone https://github.com/andreasfertig/cppinsights.gitmkdir build && cd buildcmake -G"Ninja" ../cppinsightsninja

生成的二进制文件(insights)可以在 build 文件夹中找到。

(4)在 Clang 内部构建

在 Clang 源代码树中 C++ Insights 最简单的方法,是使用 LLVM_EXTERNAL_PROJECTS 选项。

git clone https://github.com/llvm/llvm-project.gitgit clone https://github.com/andreasfertig/cppinsights.git
mkdir buildcd buildcmake -G Ninja -D=CMAKE_BUILD_TYPE=Release -DLLVM_EXTERNAL_PROJECTS=cppinsights -DLLVM_EXTERNAL_CPPINSIGHTS_SOURCE_DIR=<PATH/TO/cppinsights> [INSIGHTS CMAKE OPTIONS] ../llvm-project/llvm
ninja

cmake 选项

cmake 可启用几个选项:

在 macOS 上构建 ARM

似乎最好在配置时提供架构:

cmake -DCMAKE_OSX_ARCHITECTURES=arm64 ../cppinsights



使用方法


使用 C++ Insights 非常简单:

insights <YOUR_CPP_FILE> -- -std=c++17

当涉及到系统包含路径时,情况就变得复杂了。这些路径是二进制文件中的硬编码,似乎来自 C++ Insights 的编译器。要解决这个问题,可查看 scripts/getinclude.py,这个脚本会尝试从编译器中收集系统包含路径。如果没有选项,getinclude.py 将默认使用 g++,你也可以将其他编译器作为第一个参数传递。

下面是一个例子:

./scripts/getinclude.py-isystem/Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin/../include/c++/v1 -isystem/usr/local/include -isystem/Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin/../lib/clang/7.3.0/include -isystem/Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/include -isystem/usr/include

该脚本可与 C++ Insights 一起使用:

insights <YOUR_CPP_FILE> -- -std=c++17 `./scripts/getinclude.py`

自定义 GCC 安装

如果你用的是自定义版本的 GCC 编译器,例如 gcc-11.2.0,且未安装在编译器的默认系统路径中,那么在构建后,Clang 将无法找到正确的 libstdc++ 路径(即 GCC 的标准模板库)。如果遇到这种情况,你可以用“--gcc-toolchain=/path/GCC-1x.x.x/installed/path”来告诉 Clang/C++ Insights STL 的位置:

./cppinsights Insights.cpp -- --gcc-toolchain=${GCC_11_2_0_INSTALL_PATH} -std=c++20

这里的“${GCC_11_2_0_INSTALL

_PATH}”是你定制构建的 GCC 安装目录。

随时可用的 Docker 容器

GitHub 上还有另一个项目,可以在其中设置一个装有最新 C++ Insights 版本的 docker 容

器:C++ Insights - Docker(https://github.com/andreasfertig/cppinsights-docker)

C++ Insights @ Vim

Vim 插件可在此处下载:https://github.c

om/Freed-Wu/cppinsights.vim

C++ Insights @ VSCode

Visual Studio Code 的扩展可在此处找到:https://marketplace.visualstudio.com/items?itemName=devtbi.vscode-cppinsights

C++ Insights @ brew

至少在 macOS 上,你可通过 Homebrew 安装 C++ Insights,这要归功于这个公式:

brew install cppinsights


兼容性


我的目标是,能够与最新版本的 Clang 或者至少前一个版本保持兼容,在线网站尽量与 Clang 的最新版本保持一致。然而,由于某些问题(比如为 Windows 构建 Clang),网站的版本经常会延迟几个月。

更多详细介绍,可参看 C++ Insights 项目 GitHub 地址:https://github.com/andreasfertig/cppinsights

相关推荐

selenium(WEB自动化工具)

定义解释Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7,8,9,10,11),MozillaF...

开发利器丨如何使用ELK设计微服务中的日志收集方案?

【摘要】微服务各个组件的相关实践会涉及到工具,本文将会介绍微服务日常开发的一些利器,这些工具帮助我们构建更加健壮的微服务系统,并帮助排查解决微服务系统中的问题与性能瓶颈等。我们将重点介绍微服务架构中...

高并发系统设计:应对每秒数万QPS的架构策略

当面试官问及"如何应对每秒几万QPS(QueriesPerSecond)"时,大概率是想知道你对高并发系统设计的理解有多少。本文将深入探讨从基础设施到应用层面的解决方案。01、理解...

2025 年每个 JavaScript 开发者都应该了解的功能

大家好,很高兴又见面了,我是"高级前端进阶",由我带着大家一起关注前端前沿、深入前端底层技术,大家一起进步,也欢迎大家关注、点赞、收藏、转发。1.Iteratorhelpers开发者...

JavaScript Array 对象

Array对象Array对象用于在变量中存储多个值:varcars=["Saab","Volvo","BMW"];第一个数组元素的索引值为0,第二个索引值为1,以此类推。更多有...

Gemini 2.5编程全球霸榜,谷歌重回AI王座,神秘模型曝光,奥特曼迎战

刚刚,Gemini2.5Pro编程登顶,6美元性价比碾压Claude3.7Sonnet。不仅如此,谷歌还暗藏着更强的编程模型Dragontail,这次是要彻底翻盘了。谷歌,彻底打了一场漂亮的翻...

动力节点最新JavaScript教程(高级篇),深入学习JavaScript

JavaScript是一种运行在浏览器中的解释型编程语言,它的解释器被称为JavaScript引擎,是浏览器的一部分,JavaScript广泛用于浏览器客户端编程,通常JavaScript脚本是通过嵌...

一文看懂Kiro,其 Spec工作流秒杀Cursor,可移植至Claude Code

当Cursor的“即兴编程”开始拖累项目质量,AWS新晋IDEKiro以Spec工作流打出“先规范后编码”的系统工程思维:需求-设计-任务三件套一次生成,文档与代码同步落地,复杂项目不...

「晚安·好梦」努力只能及格,拼命才能优秀

欢迎光临,浏览之前点击上面的音乐放松一下心情吧!喜欢的话给小编一个关注呀!Effortscanonlypass,anddesperatelycanbeexcellent.努力只能及格...

JavaScript 中 some 与 every 方法的区别是什么?

大家好,很高兴又见面了,我是姜茶的编程笔记,我们一起学习前端相关领域技术,共同进步,也欢迎大家关注、点赞、收藏、转发,您的支持是我不断创作的动力在JavaScript中,Array.protot...

10个高效的Python爬虫框架,你用过几个?

小型爬虫需求,requests库+bs4库就能解决;大型爬虫数据,尤其涉及异步抓取、内容管理及后续扩展等功能时,就需要用到爬虫框架了。下面介绍了10个爬虫框架,大家可以学习使用!1.Scrapysc...

12个高效的Python爬虫框架,你用过几个?

实现爬虫技术的编程环境有很多种,Java、Python、C++等都可以用来爬虫。但很多人选择Python来写爬虫,为什么呢?因为Python确实很适合做爬虫,丰富的第三方库十分强大,简单几行代码便可实...

pip3 install pyspider报错问题解决

运行如下命令报错:>>>pip3installpyspider观察上面的报错问题,需要安装pycurl。是到这个网址:http://www.lfd.uci.edu/~gohlke...

PySpider框架的使用

PysiderPysider是一个国人用Python编写的、带有强大的WebUI的网络爬虫系统,它支持多种数据库、任务监控、项目管理、结果查看、URL去重等强大的功能。安装pip3inst...

「机器学习」神经网络的激活函数、并通过python实现激活函数

神经网络的激活函数、并通过python实现whatis激活函数感知机的网络结构如下:左图中,偏置b没有被画出来,如果要表示出b,可以像右图那样做。用数学式来表示感知机:上面这个数学式子可以被改写:...