[Kubeflow] Jupyter jovyan 사용자를 sudo 그룹에 추가하기 / 2023.06.16 kubeflow에서 jupyter를 사용할 때 사용자인 jovyan은 sudo 권한이 없다 따라서 jovyan을 sudo그룹에 추가하는 custom image를 생성해서 jupyter를 생성해보자 Step 1. Dockerfile 작성 jupyter notebook Dockerfile은 아래 github에서 확인할 수 있다 https://github.com/kubeflow/kubeflow/tree/master/components/example-notebook-servers GitHub - kubeflow/kubeflow: Machine Learning Toolkit for Kubernetes Machine Learning Toolkit for Kubernetes. Contribute to kubeflow..
[Kubernetes] NVIDIA device plugin 설치하기 / 2023.06.15 Kubernetes에서 GPU를 사용하기 위해 NVIDIA device plugin을 설치했다 아래 github 주소를 참고!!! https://github.com/NVIDIA/k8s-device-plugin#quick-start GitHub - NVIDIA/k8s-device-plugin: NVIDIA device plugin for Kubernetes NVIDIA device plugin for Kubernetes. Contribute to NVIDIA/k8s-device-plugin development by creating an account on GitHub. github.com Step 1. nvidia-container-toolkit 설치하기 distribution=$(. /etc/os-re..
[Kubernetes] local-path-storage 설치하기 / 2023.06.15 rook-ceph storageclass는 설치할 때 무슨 문제가 있는지 pv를 자동으로 생성해주지않아서 수동으로 생성해 주어야했다 따라서 local-path-storage를 설치했다 Step 1. local-path-storage 설치하기 kubectl apply -f https://raw.githubusercontent.com/rancher/local-path-provisioner/master/deploy/local-path-storage.yaml Step 2. default로 설정하기 # local-path-storage를 default 설정 kubectl patch storageclass local-path -p '{"metadata": {"annotations":{"storageclass.kub..
[Kubeflow] 계정(User) 추가하기 / 2023.06.14 Step 1. Profile 생성 먼저, profile yaml 파일을 작성한 후 kubectl apply -f 명령어로 생성하기 apiVersion: kubeflow.org/v1beta1 kind: Profile metadata: name: test # namespace spec: owner: kind: User name: sykang@email.com resourceQuotaSpec: hard: cpu: "6" memory: "16Gi" requests.nvidia.com/gpu: "1" persistentvolumeclaims: "10" requests.storage: "100Gi" profile 확인 kubectl get profile -A Step 2. configmap 수정 kubeflow를 ..
[Kubeflow] ERROR [403] poddefaults.kubeflow.org is forbidden / 2023.06.14 Kubeflow dashboard의 tensorboard를 클릭하면 아래와 같은 에러가 발생했다. [403] poddefaults.kubeflow.org is forbidden: User "system:serviceaccount:kubeflow:tensorboards-web-app-service-account" cannot list resource "poddefaults" in API group "kubeflow.org" in the namespace "kubeflow-user-example-com" 해당 오류는 사용자가 해당 리소스에 대한 권한이 없기 때문에 발생하는 것으로 보임!! "tensorboards-web-app-service-account" 사용자가 "kubeflow-user-example-..
Kubeflow 설치하기 (Ubuntu 20.04) / 2023.06.09 Step 1. 설치 환경 갖추기 https://github.com/kubeflow/manifests GitHub - kubeflow/manifests: A repository for Kustomize manifests A repository for Kustomize manifests. Contribute to kubeflow/manifests development by creating an account on GitHub. github.com 위 사이트에 들어가면 사전에 설치해야할 목록이 있다 정리해보면, 쿠버네티스 1.25 버전 (StorageClass 설치), kustomize 5.0.0 버전 버전이 다르면 설치가 되지 않으니 꼭 지킬것!!! 쿠버네티스는 설치했다고 가정하고 다음 step 부터 진행 ..
Kubernetes 설치하기 (Ubuntu 20.04) / 2023.06.06 1. 모든 노드 (마스터 및 워커) 에서 아래 작업 수행 1-1. 각 노드에서 권한 변경 sudo su 1-2. 모든 노드에서 swap, 방화벽 비활성화 swapoff -a sed -i '/swap/d' /etc/fstab sudo ufw disable 1-3. 쿠버네티스 설치에 필요한 패키지들 추가 apt-get update && apt-get install -y apt-transport-https curl curl -s https://packages.cloud.google.com/apt/doc/apt-key.gpg | apt-key add - cat
Docker 설치하기 (Ubuntu 20.04) / 2023.06.05 1. 레포지토리 업데이트, 필요한 패키지 설치 sudo apt-get update sudo apt-get install \ apt-transport-https \ ca-certificates \ curl \ gnupg \ lsb-release 2. Docker GPG key 추가 curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add - 3. Docker 레포지토리 추가 sudo add-apt-repository "deb [arch=amd64] https://download.docker.com/linux/ubuntu focal stable" 위 명령어에서 focal은 Ubuntu 20.04의 코드네임 -> 우분투 버전에 따라서..
