Amazon Web Services 解釋這次掛掉的原因…

Amazon Web Services 今天在網站上公佈了 4/21 EBS 故障的原因。雖然一開始的人為操作失誤很快就回覆(roll-back)了,不過後面造成的骨牌效應還是讓整個系統掛了(不穩定)了三天……

文章裡面有一些設計系統的時候的重點:

  • 多次失敗重試的時候要把重試的間隔拉長(back off aggressively)。
  • 想辦法在要救資料的時候可以(半)自動化。
  • 限制失敗重試的次數,如果超過的話就暫時從整個系統中隔離。

另外 AWS 也提出了這次事件的賠償方式:

For customers with an attached EBS volume or a running RDS database instance in the affected Availability Zone in the US East Region at the time of the disruption, regardless of whether their resources and application were impacted or not, we are going to provide a 10 day credit equal to 100% of their usage of EBS Volumes, EC2 Instances and RDS database instances that were running in the affected Availability Zone. These customers will not have to do anything in order to receive this credit, as it will be automatically applied to their next AWS bill. Customers can see whether they qualify for the service credit by logging into their AWS Account Activity page.

簡譯如下:不論客戶是否受到影響,只要發生問題的當時在美東地區有使用 EBS 或是 RDS,AWS會賠償 10 個整天客戶所使用的資源,以 credit 的方式(未來可以抵)給客戶。

詳細的賠償額度可以看四月份的帳單。另外這次的賠償是不用另外申請的(EC2的SLA規定低於Service Level時要另外寫信去申請才能獲得賠償)

AWS Route53 的 CLI 管理工具:Net::Amazon::Route53

在找其他資料時意外發現的:Net::Amazon::Route53。Route53 的簡介可以看之前的文章:AWS 推出 Anycast DNS 服務:Amazon Route 53

比起 Amazon 提供的陽春工具好多了,加減一個Record不用寫XML寫到死……

列出 Zone 的 Records:

jnlin@Florence [1:57am] ~> route53 -keyname my-aws-account record list jnlin.org.
jnlin.org. A 3600 69.10.61.218
jnlin.org. NS 172800 ns-225.awsdns-28.com. ns-1456.awsdns-54.org. ns-804.awsdns-36.net. ns-1569.awsdns-04.co.uk.
jnlin.org. SOA 900 ns-225.awsdns-28.com. awsdns-hostmaster.amazon.com. 1 7200 900 1209600 86400
test.jnlin.org. A 3600 127.0.0.1

刪掉一個 Record:

jnlin@Florence [1:59am] ~> route53 -keyname my-aws-account record delete jnlin.org. –name test.jnlin.org.
Record deleted

新增一個 Record:

jnlin@Florence [2:07am] ~> route53 -keyname my-aws-account record create jnlin.org. –name localhost.jnlin.org. –type A –ttl 86400 –value 127.0.0.1
Record created

Zerigo 的 GeoDNS 服務…

長輩幾個禮拜前介紹了ZerigoGeoDNS服務,這幾個禮拜測試起來還不錯,今天就把全部的量都丟上去了……

除了有一般的根據洲、國家的判斷,在北美還可以分四個區域分配不同的Server位置。另外也有提供API進去改設定…

如果付錢的話還可以客製化DNS回應的邏輯。可以用各種語言(Perl、Python、Ruby…)寫 prototype 給他們,由他們實做在他們的Server上。不過目前的GeoDNS應該就夠用了。

如果有興趣的人可以用下面的 Referral Code 註冊看看:http://www.zerigo.com/ref/kz0gcb

Adobe 在 Flash Media Server 裡支援 HTTP Live Streaming

在 NAB 裡面,Adobe宣佈在 Flash Media Server (FMS) 裡支援 HTTP Live Streaming (HLS),也就是 iOS 用的那套 Streaming 方式。

因為 Android 3.0 也支援 HLS,不出意外的話應該會成為新的Streaming標準了。

Update: 不是 Apple ,Adobe 才對。感謝far