2015年8月10日 星期一

Certified Spark Developer

Certified Spark Developer 是一張由 Databricks 提供的 Apache Spark 開發者的認證考試

關於 Certified Spark Developer 資料可以看這裡,另外這張認證是由 Oreilly 處理考試過程,詳細的考試資訊可以看 這裡

建議考前幾天要注意電腦設備和環境是否符合要求,要詳細閱讀這份文件

在這裡分享一下我的考前準備

Learning Spark 要熟讀

我把 Learning Spark 從頭到尾讀了三遍,最後在考試之前再快速複習重點一次。

不過在最後一個章節 Machine Learning with MLlib 我花較少的時間,畢竟這要有點相關知識,讀起來才比較順


Scala 與 Python 基礎語法

在考前我有把 Scala 與 Python 的基本語法搞清楚,基本上迴圈操作,類別宣告與函式定義都需要了解

另外最重要的就是集合物件的操作必須要熟悉

我本身最熟 Java,所以花在 Scala 與 Python 比較多時間


程式實作

在準備考試之前已經有寫過一些 Spark 的程式了,考前一樣有寫一些關於 RDD 與 Spark SQL 的程式

但我比較著重在 Learning Spark 的第三章與第四章的程式實作,基本上每一個 RDD 的 operation 我都有寫過至少一遍

原則上不是去背這些 RDD,是觀察這些 RDD 的結果會是什麼,例如:

rdd1.union(rdd2) 的結果資料會不會重覆,rdd1.intersection(rdd2) 的資料是否會重覆 等等的

比較複雜的是第四章,需要多花點時間去看這些 RDD 的結果會是怎樣。

另外 Java 有很多的 Interface,我也花了蠻多時間去背。





因為考試之前都沒找到過什麼考古題,在網路上也沒什麼經驗分享之類的

所以也不知道出題方向,不過對 Spark 有點認知的話,其實也猜得出來 RDD 絕對是重點

因此除了 RDD 熟讀之外,還是很扎實的讀完其他章節

以下來分享我考完的心得



在考試當中是非常嚴格的,原則上你是沒辦法作弊的....,也很難把考題拿出去,所以就憑本事拉!!

這次我的考試當中大概有 6 題左右是標準不用思考的送分題

其中這次程式題占了一半左右的篇幅,而這些程式中,以 Scala 與 Python 的語言為多數, Java 少得可憐

而程式題基本上大多是跟 RDD 和 Spark SQL 有關,並且題目絕對不是像書上那樣簡單的

所以當下真的花了很多時間在思考這些程式題,不過至少不致於困難到你算不出來,但就是要有耐心就是了

因為有不少題目本身包含了很長的程式外,連四個選項都是一長串程式......所以耐心與程式基礎很重要

基本上我認為你只要書讀得熟,RDD 與 Spark SQL 程式徹底搞懂就蠻有機會接近 Pass 了

另外除了這些程式題之外,也考了一些蠻進階的東西與一些觀念題,


如果有興趣的可以問我,不方便在網路上直接說題目 :)

下面這張照片是 隔了一個多月之後才收到的證照




2 則留言:

  1. Spark Certification Training is useful to become as knowledgable and skillful Big Data & Spark Developer. You can clear the CCA Spark and Hadoop Developer (CCA175) Examination. You will understand the basics of Big Data and Hadoop. Our company also has Spark certified developers. Actually, we are security CCTV Camera Dealers in Karachi, surveillance and communication solutions provider to business and home consumers.

    回覆刪除
  2. 作者已經移除這則留言。

    回覆刪除