f Oracle Grid 12.2 在RedHat 7.x上的安裝 ~ 迪貝之家

Oracle Grid 12.2 在RedHat 7.x上的安裝

這個case 一波三折,一開始是安裝於RedHat 7.6,結果出現底下的錯誤
CRS-4123: Oracle High Availability Services has been started.
2019/06/05 16:36:14 CLSRSC-400: A system reboot is required to continue installing.
The command '/u01/app/12.2.0/grid/perl/bin/perl -I/u01/app/12.2.0/grid/perl/lib -I/u01/app/12.2.0/grid/crs/install /u01/app/12.2.0/grid/crs/install/rootcrs.pl ' execution failed
我開始安裝的時候都已經下午四點多了,我也懶得debug,就直接把call開給Oracle。隔天到了辦公室,手動執行root.sh,去看它所指定log的內容,裡頭的東西其實沒用,浪費時間而已。再看了一下metalink網站,沒甚麼回應,只好繼續找資料,我就用CLSRSC-400這個碼去找metalink KM,有相應的文件(Doc ID 2284463.1)ALERT: root.sh Fails With "CLSRSC-400" While Installing GI 12.2.0.1 on RHEL or OL with RedHat Compatible Kernel (RHCK) 7.3 ,我就只好去提醒support,是不是這個bug,也順便跟他要patch,因為文件裡頭提到,patch 要跟著kernel版本跑,文件裡指引的連結又找不到RedHat 7.6所對應的kernel 的patch,幾經筆談,文件裡所指出的patch適用7.3 以後的版本,心裡想,你這麼肯定,那我就下載回來把它打上去。結果照著文件的語法一打patch,靠悲哩~~根本就打不上去。因為有專案時程的壓力,我就直接打了0800電話到中國大陸,我說"不管怎樣,你們今天一定要給我解決這個case"。
又幾經討論,Support說要先移除掉之前的安裝,就給了我 Doc ID 1364419.1,要我照著內容移除掉之前的安裝。我心裡就在想,還不如降版重新安裝作業系統,不過原廠都給了solution,我們就試看看吧!!照著文件做,確實deintall了之前的安裝,然後patch 也可以打了上去,但是gridSetup.sh再叫起來後,根本就不認為是一個全新的cluster,我就嘗試把oraInventory 目錄給改名及砍掉/etc/oralce,終於可以使用create a new standalone cluster,就照著安裝流程跑,結果又是root.sh出現錯誤,但不再是CLSRSC-400這個錯誤了,反而是出現了底下的錯誤
2019-06-10 14:10:09: Executing cmd: /u01/app/12.2.0/grid/bin/crsctl create scr grid
2019-06-10 14:10:09: Command output:
CRS-4046: Invalid Oracle Clusterware configuration.
CRS-4000: Command Create failed, or completed with errors.
End Command output
2019-06-10 14:10:09: Executing cmd: /u01/app/12.2.0/grid/bin/clsecho -p has -f clsrsc -m 331 "/etc/oracle/scls_scr/giddbha1"
2019-06-10 14:10:09: Command output:
CLSRSC-331: Failure initializing entries in file '/etc/oracle/scls_scr/giddbha1'
End Command output
2019-06-10 14:10:09: CLSRSC-331: Failure initializing entries in file '/etc/oracle/scls_scr/giddbha1'
我只好再用CLSRSC-331去找KM,它告訴我是root 帳號的umask不對,上系統看了一下umask的output,就沒錯阿!!能怎麼辦? 還是一樣把錯誤PO給Support
1. Change the umask of root user to 0022 on all nodes.
# umask 022
# umask
0022
2. Re-run root.sh as the root user:
GI_HOME: root.sh
對應的support一看到我的回應就撥了電話到我的桌機,可是訊號有夠爛的,根本聽不清楚他在講甚麼??最後我們就開了一個聊天室繼續筆談,他也知道我有專案時程的壓力,就建議我降版作業系統重新安裝,我說OK阿,但我要你更新在case裡頭,這樣我才有憑有據可以去要求相關人員重新安裝作業系統(這樣就知道,在這邊工作有多累了,我都得想辦法去引導原廠去講出我想走的方向)。拿到原廠的回應之後,我就請相關人員退版安裝到7.2,你以為這樣問題就解決了嗎?? 主機單位回應我Qlogic HBA卡在7.2抓不到,真是TMD......,作業系統太新,軟體支援度有問題,太舊,硬體支援度有問題,Cow...這是甚麼跟甚麼?? 7.3 kernel才能抓得到那張HBA卡,我一聽到這話,我就要主機人員把kernel升上去,我用Oracle出的補丁來解決。最後當然就是在RedHat 7.2的平台上升級至7.3 kernel,抓到Qlogic HBA卡之後,打上Patch,Grid 12.2 就順利安裝上去了,接著我就把RAC 12.2也裝了上去,大功告成。
只是這個問題,難不成在中國大陸都沒遇到過嗎?? 應該一開始就要給我最正確的解決方式才對阿!!