2016年4月3日 星期日

kernel debugging

risk management做細了,發生頻率低的事件也會需要查,才能保證SLA達到99.9999999....%之類的。現在的OS kernel是都很穩定了,但偶爾在些機器上會發生。以前都就當作偶發硬體問題重開機了,或是記憶體之類的錯誤。但細緻些,kernel debugging最好做做...這樣的話,更動少,團隊強,穩定度高的kernel應該做起來比較happy一些。

  • OS跑在實體硬體上,是可能為硬體問題。或是驅動不夠好造成。
  • OS跑在VM上,這之前看OS hackers在抱怨,虛擬層也可能有不相容問題,而OS都是根據實體硬體來寫的。誰知道你虛擬技術「虛擬」的硬體,反應是否跟實體確實相同呢?這樣我其實不是debug我的OS,而是debug你的ESX或是KVM了。不過好在這些full virtualization的技術算是很成熟了,舊版OS真還有問題,升到新版OS與hypervisor應該就OK了。

沒有留言:

張貼留言