大數據時代的海洋科技 ——訪中國海洋大學教授陳戈
如今,隨著云時代的來臨,大數據越來越受到人們的關注。在海洋領域,大數據與海洋科技互相依存關系更加密切。在前不久召開的2016全球大數據應用研究論壇上,中國海洋大學教授陳戈接受了記者專訪,他對海洋大數據發展現狀、海洋學發展與大數據的關系以及大數據在推動人類認識海洋所發揮的作用等方面進行了分析和解讀。
海洋大數據呈現爆炸式增長
當前,大數據發展的情況是怎樣的,海洋大數據在全球大數據中占有多大的比例?
2015年,國務院密集發布了3個與大數據有關的行動綱要,大數據的重要性也被提到前所未有的高度。不僅國內非常重視大數據,從2013年開始,美國、英國、法國也頒布了各自國家一系列重要的大數據的國家戰略。
學術界非常關注大數據,最近10年,4種頂級期刊發表大數據相關論文共101篇。應用這些大數據,人類開展了許多熱點研究,包括超級云計算、移動互聯網、生物醫藥等。
在技術方面,大數據發展面臨突破與挑戰并存的局面。第一,隨著以谷歌GFS分布式計算架構為主的系統策略的發布,大數據正在經歷從摩爾時代到后摩爾時代的跨越。第二,大數據分析挖掘技術實現了若干重要突破,但同時也面臨新的挑戰。現在對大數據的挖掘,不能只滿足于對它的簡單因果關系的理解,而要對它的時空關聯進行進一步挖掘,這對現有的方法提出新的挑戰。另外,隨著科學可視化增強現實、虛擬現實以及APP等應用技術的飛速發展,大數據可視化將發生一系列深刻的變革。與此同時,又面臨從實時多維動態到人機自然交互高端可視化的挑戰。所以在技術方面,我們有突破,這是可喜的一面,另一方面,又遇到了新的瓶頸,需要新的突破。
海洋整體屬于大地學的一部分,說到海洋大數據,往往要涉及到地球大數據,即空間地海大數據。未來空間地海大數據將會達到EB級,日增量可達PB級。空天、陸地大數據增速為30%,海洋大數據增速將達到40%,呈爆炸式增長。
隨著我國建設海洋強國戰略和“一帶一路”實施,海洋的重要性被提到前所未有的高度,發展海洋大數據對于我國海洋事業的發展具有重要意義。
目前,在海洋大數據的工程應用方面,我國先后推出了數字海洋、智慧海洋。
機遇和挑戰并存
海洋科學的發展與大數據的關系是怎樣的?
35年前,從事海洋研究的人面臨最大的困難就是數據匱乏,獲取數據的手段非常之少。35年后的今天,之所以有了這么多的大數據并且呈爆炸式增長,主要歸因于技術的進步。
從海洋科學發展的歷史來看,在18世紀,海洋科研人員主要從事海洋理論研究。隨著時間的推移和技術的進步,特別是制造業、工業化、信息化的發展,人類有了越來越多觀測海洋、獲取海洋數據的手段,包括19世紀70年代的調查船、20世紀30年代的潛水器、40年代的海洋浮標,還有60年代的衛星遙感以及海洋觀測陣列等。
從上世紀末到本世紀初,人類又發明了海洋Argo浮標,目前有4000個浮標在2000米以下的海洋源源不斷提供海洋的數據。當今,我們擁有了更多的手段來觀測和獲取關于地球特別是海洋的圖像、數據等信息,繼而進一步推動了海洋科學的發展。
當前和今后一個時期,大數據發展的機遇和挑戰并存,從近期來看,肯定是挑戰大于機遇。從中遠期來看,則是機遇大于挑戰。是什么意思呢?就是面對突如其來的爆炸式增長的大數據,我們在技術、科學、理論等方面都沒有做好準備,還沒有辦法把獲得的有價值的數據保存下來。
深刻改變人類對海洋的認識
海洋大數據的發展對人類認識海洋起到哪些作用?
有了技術支撐,我們既要了解海洋的過去、現在,更要預測海洋的未來。
例如,我們最早認識的渦旋只是一個圓圈,之后隨著遙感技術的發展,便對渦旋有了新的認識。現在利用大數據,我們了解到海洋當中的渦旋有成千上萬個,這對船舶航行和安全非常重要。如今,我們通過衛星遙感追蹤一個渦旋,并對它進行為期半年的精細觀測,這些是在大數據和高科技出現之前無法做到的。
再拿全球海浪波浪分布圖來講。眾所周知,無風不起浪,有風的地方就有浪,這是一般大眾的理解。但對于海洋科技工作者來說,我們把海浪分成兩類,一類是有風的時候起浪,一類是沒有風的時候也會出現的浪,即涌浪,有時候涌浪的危害更大,因為它沒有預警。刮風的時候我們知道浪來了,但不刮風的時候,浪來得猝不及防。在小數據年代我們根本無法提取信息,而在大數據年代,我們知道全球涌浪的數據,哪些地方涌浪強,都可以看到。以上兩個例子,都是大數據給我們帶來的新的科學認知。
我經常講一句話,有了大數據,我們不需要牛頓也能夠發現牛頓定律。為什么?牛頓定律非常簡單,用腦子想和利用數據去發現它,難度差了好幾個量級。大家可能會問,我們這一代跟父輩、祖輩比,創新能力是增強了還是減弱了,是進步了還是后退了?在我們這個時代,牛頓、愛因斯坦這樣的科學家是非常非常少了。但由于大數據時代的到來,科學門檻大大降低,使得能夠參與到科學中的人大大增加了,所以我們的合力仍然超過了父輩、祖輩那個時代。從這個意義上說,當前科學和技術的進步,是加快了,而不是減慢了。
名詞解釋
●增強現實:是一種實時地計算攝影機影像的位置及角度并加上相應圖像、視頻、3D模型的技術,這種技術的目標是在屏幕上把虛擬世界套在現實世界并進行互動。這種技術在1990年提出。隨著隨身電子產品CPU運算能力的提升,預期增強現實的用途將會越來越廣。
●大數據可視化:就是指將結構或非結構數據轉換成適當的可視化圖表,然后將隱藏在數據中的信息直接展現于人們面前。