百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

想做运维却不知道怎么入门?我们得先了解一下什么是运维

itomcoil 2024-12-31 12:24 27 浏览

一、运维概述

1.运维职位定义

在技术人员之间,一般对运维有一个开玩笑的认知,运维就是修电脑的,装网线的,背锅的岗位。

其实不然,运维是一个非常广泛的定义,在不同的公司不同的阶段有着不同的职责与定位,如果以operation(运维英文)字面定义去理解,认识就是敲几行操作命令的工作,那就错了。

在大型的公司,对于运维工作要求越来越高,也催生了更细化的运维分工,从大的方向可以分为网站运维、基础运维、系统运维、网络运维、数据库运维、IT运维、运维开发、大数据运维、云计算运维、运维安全、运维架构师、运维专家等方向。

2.运维行业前景

① 从行业角度看,随着互联网的发展,网站规模越来越大,架构越来越复杂,对于有经验对于运维人才需求量多,而且越老越值钱

②从个人角度看,运维工程师技术含量要求越来越高,同时也是对公司应用和架构最熟悉的人,越来越得到重视

③运维是一个融合多学科(网站、系统、开发、安全、应用架构、存储等)的综合性岗位,给运维工程师提供了一个很好的个人能力与技术的发展空间,技多不压身。

④运维工作的相关经验非常重要,而且也会成为个人的核心竞争力,优秀的运维工程具备很好的各层面问题的解决能力及方案提供、全局思考的能力等。

⑤由于运维岗位所接触的知识面非常广阔,更容易培养或者发挥出个人某些方面的特长或者爱好,如内核、网络、开发、数据库等方面,

⑥国内外对运维人才的需求非常迫切,运维工程师的薪资也水涨船高,与研发、测试技术部门持平甚至超出

3.运维职业发展

  • 技术专家发展规划:初中级工程师 -> 高级工程师 -> 架构师 -> 专家适宜人群:比较喜欢挑战,热爱技术,有较强钻研精神,在某一领域有深入的理解,性格比较内向。
  • 技术管理发展规划:初中级工程师 -> 高级工程师 -> 主管/经理 -> 总监 -> CTO(首席技术官)适宜人群:技术知识面广,有一些管理思维,善于交际,表达沟通能力强,经常关注行业内动态和主流技术。
  • 二、运维职责划分

    1、初级主要工作

    • 修电脑、电脑巡检
    • 服务器上下架
    • 网络服务部署
    • 网站平台搭建与维护

    ①linux基础

    刚开始阶段需要熟悉Linux操作系统安装,目录结构、启动流程等 。

    ②系统管理

    主要学习Linux系统,生产环境中基本都在字符界面完成工作,所以要掌握常用的几十个基本管理命令,包括用户 管理、磁盘分区、软件包管理、文件权限、文本处理、进程管理、性能分析工具等 。

    ③网络基础

    熟悉OSI和TCP/IP模型,知道基本的交换机、路由器概念及实现原理 。

    ④Shell脚本编程基础

    掌握Shell基本语法结构,能编写简单的脚本。

    2、 中级主要工作

    • 集群网站平台搭建
    • 数据库基本管理
    • 监控系统搭建
    • 脚本化工作

    ①网络服务

    常见的网络服务要会部署,比如vsftp、nfs、samba、bind、dhcp等。 代码版本管理系统少不了,可以学习下主流的GIT,能部署和简单使用。 经常在服务器之间传输数据,所以要会使用:rsync和scp。数据同步:inotify/sersync。 重复性完成一些工作,可写成脚本定时去运行,所以得会配置Linux下的定时任务服务crond。

    ②Web服务

    每个公司基本都会有网站,能让网站跑起来,就需要搭建Web服务平台了。

    如果是用PHP语言开发的,通常搭建LNMP网站平台,这是一个技术名词组合的拼写,分开讲就是得会部署Nginx、MySQL和PHP。 如果是JAVA语言开发的,通常使用Tomcat运行项目,为了提高访问速度,可以使用Nginx反向代理Tomcat, Nginx处理静态页面,Tomcat处理动态页面,实现动静分离。不是会部署这么简单,还要知道HTTP协议工作原理、简单的性能调优。

    ③负载均衡器

    单台服务器终究资源有限,抵抗高访问量肯定是无法支撑的,解决此问题最关键的技术就是采用负载均衡器,水平扩展多台Web服务器,同时对外提供服务,这样就成倍扩展性能了。负载均衡器主流开源技术有LVS、HAProxy和Nginx。一定要熟悉一两个!

    ④数据库

    数据库选择MySQL,它是世界上使用最为广泛的开源数据库。也要会一些简单的SQL语句、用户管 理、常用存储引擎、数据库备份与恢复。 想要深入点,必须会主从复制、性能优化、主流集群方案:MHA、MGR 等。 NoSQL这么流行当然也少不了,学下Redis、MongoDB这两个就好了。

    ⑤监控系统

    监控必不可少,是及时发现问题和追溯问题的救命稻草。可以选择学习主流的Zabbix、Prometheus开源监控系 统,功能丰富,能满足企业级监控需求。监控点包括服务器硬件、服务器性能、API、业务、PV/UV、日志等方 面。 也可以弄个仪表盘展示几个实时关键的数据,比如Grafana,会非常炫酷。

    ⑥日志分析系统

    日志也很重要,定期的分析,可发现潜在隐患,提炼出有价值的东西。 主流日志系统:ELK Stack 学会部署使用, 能分析日志并可视化,方便故障排查。

    ⑦安全防范

    安全很重要,不要等到系统被攻击了,再做安全策略,此时已晚!所以,当一台服务器上线后应马上做安全访问控 制策略,比如使用iptables限制只允许信任源IP访问,关闭一些无用的服务和端口等。 一些常见的攻击类型一定得 知道啊,否则怎么对症下药呢!比如CC、DDOS、ARP等。

    ⑧Shell脚本编程进阶

    Shell脚本是Linux自动完成工作的利器,必须得熟练编写,所以得进一步学习函数、数组、信号、发邮件等。 文本,必需学会处理三剑客(grep、sed、awk),Linux下文本处理就指望它们了。

    ⑨Python/Go开发基础

    Shell脚本只能完成一些基本的任务,想要完成更复杂些的任务,比如调用API、多进程等。就需要学高级语言了。 Python是运维领域使用最多的语言,简单易用,学它准没错!此阶段掌握基础就可以了,例如基本语法结构、文 件对象操作、函数、迭代对象、异常处理、发邮件、数据库编程等。

    3、 高级主要工作

    • 亿级网站架构设计
    • 性能优化
    • 容器化落地
    • 大规模自动化运维
    • 平台化工作

    ①Web静态缓存

    用户老喊着访问网站慢,看看服务器资源还很富裕啊!网站访问慢也许不是服务器资源饱和导致的,影响因素很 多,例如网络、转发层数等。 对于网络,存在南北通信问题,之间访问会慢,这个可以使用CDN解决,同时缓存 静态页面,尽可能将请求拦截在最上层响应,减少后端请求和响应时间。 如果不用CDN,也可以使用Squid、 Varnish、Nginx这样的缓存服务实现静态页面缓存,放到流量入口处 。

    ②集群

    单台服务器终究资源有限,抵抗高访问量肯定是无法支撑的,解决此问题最关键的技术就是采用负载均衡器,水平 扩展多台Web服务器,同时对外提供服务,这样就成倍扩展性能了。负载均衡器主流开源技术有LVS、HAProxy和 Nginx。一定要熟悉一两个! Web服务器性能瓶颈解决了,数据库更为关键,还是采用集群,就拿MySQL来说, 可以一主多从架构,在此基础上读写分离,主负责写,多从负责读,从库可水平扩展,前面再来个四层负载均衡 器,承载千万级PV,妥妥的! 高可用软件也得会,避免单点的利器,主流的有Keepalived、Heartbeat等。 随着业务扩展,网站图片越来越多!NFS共享存储支撑不过了,处理很慢!上分布式文件系统,并行处理任务,无 单点,高可靠,高性能等特性,主流的有FastDFS、MFS、HDFS、Ceph、GFS等。初期的话我建议学习下 FastDFS,能满足中小规模需求。

    ③容器化

    硬件服务器资源利用率很低,甚是浪费!可以把空闲多的服务器虚拟化,弄成很多个的虚拟机,每个虚拟机就是一 个完整的操作系统。可以很大程度提高资源利用率。主流私有云平台实现:KVM+OpenStack 虚拟机作为基础平台 还可以,但应用业务弹性伸缩也太重量了吧!启动好几分钟,文件又这么大,快速扩展太费劲了! 好说,上容器,容器主要特点就是快速部署和环境隔离。一个服务封装到镜像中,分分钟钟可创建几百个容器。 主流的容器技术非Docker莫属了。 当然,生产环境单机Docker大多数情况下是无法满足业务需求的,可以基于Kubernetes构建容器平台,集群化管理容器,形成一个大的资源池,为基础架构提供有力的支撑。

    ④自动化运维

    反反复复重复的工作,不但提高不了效率,价值也得不到体现。 一切运维工作标准化,例如环境版本、目录结构、操作系统等统一。在标准化基础上才能更方面的自动化,点点鼠标或者敲几个命令即可完成一项复杂的工作任务,爽哉爽哉! 因此,所有的操作尽可能自动化,减少人为失误,提高工作效率。 主流服务器集中管理工具: Ansible、Saltstack 持续集成工具:Jenkins、Gitlab 。

    ⑤Python开发进阶

    可以再深入学习下Python开发,掌握面向对象编程。 最好也掌学习一个Web框架开发网站,例如Django、Flask,主要是开发运维管理系统,将一些复杂的流程写到平台中,再集成集中管理工具,可打造一个属于运维自己的管理平台。

    ⑥性能优化

    只会部署是远远不够的,性能优化能最大化提升服务承载量。 这块也是比较难的,也是高薪的关键点之一,为了钱也得下点功夫学习啊! 可以从硬件层、操作系统层、软件层和架构层维度展开思考。


    三、结语

    本文非原创,笔者只是搜集整理了运维工作的概述、发展前景和如何在职业路上的发展,一方面分享给头条的朋友,另一方面给自己的日后回顾。



    相关推荐

    selenium(WEB自动化工具)

    定义解释Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7,8,9,10,11),MozillaF...

    开发利器丨如何使用ELK设计微服务中的日志收集方案?

    【摘要】微服务各个组件的相关实践会涉及到工具,本文将会介绍微服务日常开发的一些利器,这些工具帮助我们构建更加健壮的微服务系统,并帮助排查解决微服务系统中的问题与性能瓶颈等。我们将重点介绍微服务架构中...

    高并发系统设计:应对每秒数万QPS的架构策略

    当面试官问及"如何应对每秒几万QPS(QueriesPerSecond)"时,大概率是想知道你对高并发系统设计的理解有多少。本文将深入探讨从基础设施到应用层面的解决方案。01、理解...

    2025 年每个 JavaScript 开发者都应该了解的功能

    大家好,很高兴又见面了,我是"高级前端进阶",由我带着大家一起关注前端前沿、深入前端底层技术,大家一起进步,也欢迎大家关注、点赞、收藏、转发。1.Iteratorhelpers开发者...

    JavaScript Array 对象

    Array对象Array对象用于在变量中存储多个值:varcars=["Saab","Volvo","BMW"];第一个数组元素的索引值为0,第二个索引值为1,以此类推。更多有...

    Gemini 2.5编程全球霸榜,谷歌重回AI王座,神秘模型曝光,奥特曼迎战

    刚刚,Gemini2.5Pro编程登顶,6美元性价比碾压Claude3.7Sonnet。不仅如此,谷歌还暗藏着更强的编程模型Dragontail,这次是要彻底翻盘了。谷歌,彻底打了一场漂亮的翻...

    动力节点最新JavaScript教程(高级篇),深入学习JavaScript

    JavaScript是一种运行在浏览器中的解释型编程语言,它的解释器被称为JavaScript引擎,是浏览器的一部分,JavaScript广泛用于浏览器客户端编程,通常JavaScript脚本是通过嵌...

    一文看懂Kiro,其 Spec工作流秒杀Cursor,可移植至Claude Code

    当Cursor的“即兴编程”开始拖累项目质量,AWS新晋IDEKiro以Spec工作流打出“先规范后编码”的系统工程思维:需求-设计-任务三件套一次生成,文档与代码同步落地,复杂项目不...

    「晚安·好梦」努力只能及格,拼命才能优秀

    欢迎光临,浏览之前点击上面的音乐放松一下心情吧!喜欢的话给小编一个关注呀!Effortscanonlypass,anddesperatelycanbeexcellent.努力只能及格...

    JavaScript 中 some 与 every 方法的区别是什么?

    大家好,很高兴又见面了,我是姜茶的编程笔记,我们一起学习前端相关领域技术,共同进步,也欢迎大家关注、点赞、收藏、转发,您的支持是我不断创作的动力在JavaScript中,Array.protot...

    10个高效的Python爬虫框架,你用过几个?

    小型爬虫需求,requests库+bs4库就能解决;大型爬虫数据,尤其涉及异步抓取、内容管理及后续扩展等功能时,就需要用到爬虫框架了。下面介绍了10个爬虫框架,大家可以学习使用!1.Scrapysc...

    12个高效的Python爬虫框架,你用过几个?

    实现爬虫技术的编程环境有很多种,Java、Python、C++等都可以用来爬虫。但很多人选择Python来写爬虫,为什么呢?因为Python确实很适合做爬虫,丰富的第三方库十分强大,简单几行代码便可实...

    pip3 install pyspider报错问题解决

    运行如下命令报错:>>>pip3installpyspider观察上面的报错问题,需要安装pycurl。是到这个网址:http://www.lfd.uci.edu/~gohlke...

    PySpider框架的使用

    PysiderPysider是一个国人用Python编写的、带有强大的WebUI的网络爬虫系统,它支持多种数据库、任务监控、项目管理、结果查看、URL去重等强大的功能。安装pip3inst...

    「机器学习」神经网络的激活函数、并通过python实现激活函数

    神经网络的激活函数、并通过python实现whatis激活函数感知机的网络结构如下:左图中,偏置b没有被画出来,如果要表示出b,可以像右图那样做。用数学式来表示感知机:上面这个数学式子可以被改写:...