文章标签 ‘服务器’
2013一月1

DELL 2850服务器重装系统

注意几点:

2012十一月23

Dell Precision workstation 490 增加硬盘过程

昨晚因为一台Dell workstation 490的开发服务器硬盘空间用完了,需加一块硬盘使用。本以为加上就可以了,但重新开机后发现找不到硬盘。重拆机箱,把数据线、电源线都更换过,还是一样。把原来服务器上的硬盘取下来,换上新的硬盘,又能识别。于是重新接上两块硬盘,进到BIOS查看,在第一个接口发现了原来硬盘的信息,在后面几个接口都找不到硬盘信息。但是却在“Drives”项内看到有一项为“SATA Operation”,默认为“自动检测/AHCI”,旁边还有两选项分别为“RAID Autodetect/ATA”、“RAID On”。然后就轻松了,更改设置为“RAID Autodetect/ATA”,启动服务器检查,搞定

2012四月24

Web服务器C盘清理办法

  1. 系统日志文件及时清理: C:\WINDOWS\system32\logfiles(这个是默认的路径,IIS中可以进行设置,具体设置要以IIS为准) 时间长了会很大


2012四月13

旧文:2009-12-09 网站访问故障问题与改进方法

  • 现象
    • 2009-12-09 早上8:00多个客户电话反馈网站打开不正常,现象如下
      • 部分网站打开不了(其中一台Web1)
      • 部分网站可以打开,但样式和图片加载不了(web2上的网站,但图片和样式都在web2)
      • 从3:05分持续到近9:00才发现解决
  • 原因
    • Web1上的IIS被重启了(蓝盾监控重启导致IIS重启),重启后被加入了蓝盾的通配符映射,导致访问出错,去掉通配符访问即可
    • 没有及时发现的原因
      • 服务器监控,短信通知没有到位:账户没有余额,管理不善导致
  • 改进
    • 网站状态监控
      • 网站保姆:短信和邮件通知
        • 发送短信到多人,设置第一、第二处理负责人
        • 将图片、样式的url加入监控
      • 监控宝:12月底短信服务推出后,启用监控宝,停止网站保姆
    • IIS操作
      • 尽量减少影响的范围,非维护时间,不进行任何非必要的操作
    • 服务器蓝盾监控
      • 卸载掉

Update:2012年4月13日

2012二月15

动态IP服务器监控在监控宝上的设置

OA服务器在2月14日凌晨4点因为硬件问题当机了,但是由于没有报警系统,直到早上上班时有同事反馈才知道(详见: 2012年2月14日公司内部某服务器故障解决记录)。知道问题及时处理,一贯是技术部的风格,所以立即将OA的服务器利用监控宝的功能监控起来。以下是设置详细步骤:

2012二月14

2012年2月14日公司内部某服务器故障解决记录

  1. 故障发现、处理过程简记
    1. 8:30到公司,项目组同事收到反馈CRM无法登陆,确认是服务器问题,无法Ping到
    2. 联系网管强哥解决,尝试重启,连接显示器查看但无任何反应
    3. 9:00左右强哥初步判断是服务器硬件故障,下架检查,发现原因为主板一个部件烧坏
    4. 9:00-10:30 恢复备份
      1. 服务器硬盘挂接到强哥硬盘

        其实这里有个更快的解决办法,直接将硬盘挂接到251或者其他可以挂接的服务器

      2. 将2月13日04:00的备份(2.6G),拷贝到251服务器恢复备份,CRM只可以进行查询,但还存在两个问题:2月13工作日的数据没有;由于同步无法配置,导致只能进行查询。在实际操作过程中碰到若干个问题
        1. 要修改那些配置文件不够熟悉,主要是要修改数据库连接
          1. CRM.exe.config
          2. Log4net日志记录配置有三个地方,都是以.log4net后缀结尾
            1. CRM
            2. AutoUpdater
            3. CRMLocalService
        2. CRMLocalService修改配置后还是报错,导致用户使用后会卡一次并在不断发送报警短息:本地没有运行库的配置文件
        3. 用户拷贝配置文件后,都是报AutoUpdate.exe占用错误,需要一个个结束进程,才能覆盖。
        4. 远程连接251服务器总出问题,具体见后面关于远程桌面连接的说明
    5. 10:30-12:00 恢复2月13日最新的数据并正常 同时联系 修理服务器
      1. 由于CRM数据库日志文件很大(42G,用到完整日志模式),

        尝试单个mdf文件恢复数据库,由于服务器异常中断,无法重建日志文件

      2. 到此就剩下三个选择
        1. 最佳:服务器修理好,挂接硬盘就一切OK
        2. 其次:将硬盘挂接到其他服务器,但有个问题,就是数据库同步需要重新设置有些麻烦
        3. 第三:将日志文件拷贝251服务器,在这里进行恢复,面临的问题跟2是一致的。
      3. 后续联系强哥,确定服务器可以较快修好,决定拷贝日志文件的同时等服务器修理好搬回启用(拷贝日志文件需要耗时70分钟)
    6. 12:50左右,服务器修理好,搬回公司,挂接硬盘即可。同时日志文件的拷贝也已经结束了
    7. 14:06 服务器启动,CRM运行检查正常,恢复CRM正常使用。从发现故障到彻底解决持续近6个小时。
  2. 服务器故障实际发生时间:2012年2月13日21:42分,从CRMLocalService的日志可以准确看出。