SRESEARCH AGGREGATION

GPU云服务器

安全稳定,可弹性扩展的GPU云服务器。
SRE
这样搜索试试?

SRE问答精选

USDP社区版检查节点环境未通过

回答:可将描述信息中Execute部分的命令复制出,并ssh到响应的节点执行,看下具体执行时是什么问题原因导致的执行失败,然后解决该问题。若未发现问题,因执行的是stop usdp agent操作,可以尝试kill到其进程,然后重试。

sunxiaoyong0307 | 832人阅读

usdp2.0 点击开始不是提示illegal arguments

回答:上传的图片裂了,看不见内容

jiangyu2108 | 662人阅读

usdp部署安装Prometheus失败

问题描述:usdp部署安装Prometheus失败,执行失败的安装任务如下:[失败] [node129]通过 Restful 重载 Prometheus 配置文件日志报错信息如下:2023-03-22 10:42:31 [AsyncTask] Task Started: [node129]通过 Restful 重载 Prometheus 配置文件TaskInfo:[ hostname: node...

1175687813 | 1091人阅读

SRE精品文章

  • 活动实录丨SRE在传统企业中的落地实践

    ...续交付工具等等,都有一套方法和理念,今天主要分享下SRE理念在传统企业中的落地实践。 随着技术的发展,运维环境发生了新变化,比如互联网的场景下,线上业务和线下业务的差异非常大。 大规模、分布化: 从传统的封...

    wums 评论0 收藏0
  • 活动实录丨SRE在传统企业中的落地实践

    ...续交付工具等等,都有一套方法和理念,今天主要分享下SRE理念在传统企业中的落地实践。 随着技术的发展,运维环境发生了新变化,比如互联网的场景下,线上业务和线下业务的差异非常大。 大规模、分布化: 从传统的封...

    vpants 评论0 收藏0
  • SRECon Day1 | 比起干货满满,更吸引我的是画风清奇

    SRECon17 第一天下来的感觉就是高大上, 组织者 USENIX ( Advanced Computing Systems Association )高大上,赞助商们(谷歌, LinkedIn ,微软, Netflix , Facebook , Twitter , Hulu , Spotify 等)高大上,更高大上就是会议地点旧金山 CA ,美...

    kaka 评论0 收藏0
  • SRECon Day1 | 比起干货满满,更吸引我的是画风清奇

    SRECon17 第一天下来的感觉就是高大上, 组织者 USENIX ( Advanced Computing Systems Association )高大上,赞助商们(谷歌, LinkedIn ,微软, Netflix , Facebook , Twitter , Hulu , Spotify 等)高大上,更高大上就是会议地点旧金山 CA ,美...

    jsbintask 评论0 收藏0
  • 虎牙直播运维负责人张观石 | 解密SRE的六种能力及虎牙运维实践

    ...Flyme、百度云主办的第十三期魅族开放日《虎牙直播平台SRE实践》演讲中的分享内容整理而成。 张观石,拥有10余年网站开发、架构、运维经验;目前关注互联网服务可靠性系统工程、运维平台的规划建设、网站高可用架构等方...

    ixlei 评论0 收藏0
  • 虎牙直播运维负责人张观石 | 解密SRE的六种能力及虎牙运维实践

    ...台的运维挑战 二、 我们的思考和运维实践 (一) Google SRE介绍 • SRE是什么 • Google SRE方法论(二) 我们的思考:运维的六种能力 (三) 我们的运维实践 运维可靠性管理 感知能力 修复能力 反脆弱能力 保障能力 安全能力...

    Jonathan Shieber 评论0 收藏0
  • 为高效 Ops 和 SRE 团队准备的 10 个开源 k8s 工具

    如果你正在 Kubernetes 上工作,你的 SRE 和 Ops 团队需要正确的工具来确保Kubernetes集群的高可用和在其中运行的工作负载。这里我们列出了10个开源Kubernetes工具来使得你的SRE和Ops团队更高效的达到他们的服务水平目标(SLA)。 Ku...

    Harriet666 评论0 收藏0
  • 为高效 Ops 和 SRE 团队准备的 10 个开源 k8s 工具

    如果你正在 Kubernetes 上工作,你的 SRE 和 Ops 团队需要正确的工具来确保Kubernetes集群的高可用和在其中运行的工作负载。这里我们列出了10个开源Kubernetes工具来使得你的SRE和Ops团队更高效的达到他们的服务水平目标(SLA)。 Ku...

    KevinYan 评论0 收藏0
  • 听说支付宝有一个“疯起来连自己都打”的项目

    ...技术红军。在支付宝,蓝军从属于蚂蚁金服技术风险部(SRE),而红军则包括SRE及各业务部门的技术团队。 说到SRE,就需要科普一下了。SRE全拼为Site Reliability Engineer,是软件工程师和系统管理员的结合,是一种要求极高的技术...

    trigkit4 评论0 收藏0
  • 活动实录 | 京东金融PE谈如何颠覆应用运维认知

    导读:[GO SRE!] 为数人云SRE系列活动专题,本文是3月4日北京站线下活动当西方的SRE遇上东方的互联网中京东金融王超老师的分享。 他将从SRE,Devops, PE间的关系开始,介绍企业该如何构建适合自己的运维组织架构并管...

    刘永祥 评论0 收藏0
  • 活动实录 | 京东金融PE谈如何颠覆应用运维认知

    导读:[GO SRE!] 为数人云SRE系列活动专题,本文是3月4日北京站线下活动当西方的SRE遇上东方的互联网中京东金融王超老师的分享。 他将从SRE,Devops, PE间的关系开始,介绍企业该如何构建适合自己的运维组织架构并管...

    DevTTL 评论0 收藏0
  • 他山之石——运维平台哪家强?

    ...后,难以保证代码开发的时间。 近年来,国内也兴起了 SRE 这种高级运维职业,特别是在云计算行业,SRE 的职业要求非常高,需要精通诸如网络、编程、算法、数据结构、操作系统、安全等知识与技能。当云平台出现网络故障...

    mylxsw 评论0 收藏0

推荐文章

相关产品

<