Google Cloud AutoML Vision : 자체 머신 러닝 모델 교육

콘텐츠

데이터 세트 준비
Google Cloud Platform 무료 평가판 신청
새로운 GCP 프로젝트 만들기
Cloud AutoML 및 스토리지 API 사용
Cloud Storage 버킷 생성
훈련 시간 : 데이터 세트 구축
머신 러닝 모델 교육
모델이 얼마나 정확합니까?
모델을 시험해보십시오!
마무리

머신 러닝 (ML)은 컴퓨터를 가르치는 공상 과학 개념입니다. ML에서는 머신 학습 모델이 자동으로 처리 할 컨텐츠 유형을 나타내는 일부 데이터를 제공 한 다음 해당 데이터를 기반으로 모델이 자체 학습합니다.

기계 학습은 최첨단 일 수도 있지만 거대한 진입 장벽. ML을 사용하려면 일반적으로 기계 학습 전문가 또는 데이터 과학자를 고용해야하며,이 두 직업 모두 현재 수요가 매우 높습니다!

Google의 Cloud AutoML Vision은 ML 경험이없는 경우에도 머신 러닝 모델을 만들 수있게하여 ML을 대중에게 제공하는 것을 목표로하는 새로운 머신 러닝 서비스입니다. Cloud AutoML Vision을 사용하면 사진의 내용과 패턴을 식별 할 수있는 이미지 인식 모델을 만든 다음이 모델을 사용하여 후속 이미지를 자동으로 처리 할 수 있습니다.

이러한 종류의 시각 기반 ML은 다양한 방식으로 사용될 수 있습니다. 사용자가 스마트 폰을 가리키는 랜드 마크, 제품 또는 바코드에 대한 정보를 제공하는 앱을 만들고 싶습니까? 또는 사용자가 재료, 색상 또는 스타일과 같은 요소를 기반으로 수천 개의 제품을 필터링 할 수있는 강력한 검색 시스템을 만들고 싶습니까? 머신 러닝은 이러한 종류의 기능을 제공하는 가장 효과적인 방법 중 하나입니다.

아직 베타 버전이지만 Cloud AutoML Vision을 사용하여 사진의 패턴과 콘텐츠를 식별하는 맞춤형 기계 학습 모델을 구축 할 수 있습니다. 모든 머신 러닝 버즈에 대한 정보를 찾고자한다면이 기사에서 직접 이미지 인식 모델을 구축하고 새로운 사진을 자동으로 처리하는 방법을 설명하겠습니다.

데이터 세트 준비

Cloud AutoML로 작업 할 때는 라벨이 지정된 사진을 데이터 세트로 사용합니다. 원하는 사진이나 라벨을 사용할 수 있지만이 자습서를 간단하게 유지하기 위해 개 사진과 고양이 사진을 구분할 수있는 간단한 모델을 만들어 보겠습니다.

모델의 특성에 관계없이 첫 번째 단계는 적절한 사진을 소싱하는 것입니다!

Cloud AutoML Vision에는 레이블 당 10 개 이상의 이미지가 필요하거나 이미지 당 여러 개의 레이블이있는 모델과 같은 고급 모델의 경우 50 개가 필요합니다. 그러나 더 많은 데이터를 제공할수록 모델이 후속 컨텐츠를 올바르게 식별 할 가능성이 높아 지므로 AutoML Vision 문서는 적어도 모델 당 100 개의 예. 불공정 분포는 모델이 가장 "인기있는"범주에 대한 편견을 보이도록 권장하기 때문에 레이블 당 대략 동일한 수의 예제를 제공해야합니다.

최상의 결과를 얻으려면 트레이닝 이미지가이 모델에서 발생할 수있는 다양한 이미지를 나타내야합니다. 예를 들어, 다른 각도, 더 높은 해상도 및 더 낮은 해상도 및 다른 배경으로 촬영 한 이미지를 포함해야 할 수 있습니다. AutoML Vision은 최대 파일 크기가 30MB 인 JPEG, PNG, WEBP, GIF, BMP, TIFF 및 ICO 형식의 이미지를 허용합니다.

Cloud AutoML Vision 서비스를 실험하고 있으므로 가능한 한 빠르고 쉽게 데이터 세트를 생성하고 싶을 것입니다. 일을 간단하게 유지하기 위해 Pexels에서 개와 고양이의 무료 재고 사진을 다운로드 한 다음 고양이와 개 사진을 별도의 폴더에 저장하여 나중에 사진을 쉽게 업로드 할 수 있습니다.

프로덕션 환경에서 사용할 데이터 세트를 구축 할 때는 편견 치료를 방지하기 위해 책임있는 AI 관행을 고려해야합니다. 이 주제에 대한 자세한 내용은 Google의 포괄적 ML 가이드 및 책임 AI 관행 문서를 확인하십시오.

AutoMl Vision에 데이터를 업로드하는 세 가지 방법이 있습니다.

레이블에 해당하는 폴더에 이미 정렬 된 이미지를 업로드하십시오.
이미지와 관련 카테고리 레이블이 포함 된 CSV 파일을 가져옵니다. 로컬 컴퓨터 또는 Google Cloud Storage에서이 사진을 업로드 할 수 있습니다.
Google Cloud AutoML Vision UI를 사용하여 이미지를 업로드 한 다음 각 이미지에 레이블을 적용하십시오. 이것이이 튜토리얼에서 사용할 방법입니다.

Google Cloud Platform 무료 평가판 신청

Cloud AutoML Vision을 사용하려면 Google Cloud Platform (GCP) 계정이 필요합니다. 계정이없는 경우 무료로 Cloud Platform 사용해보기 페이지로 이동 한 후 지침에 따라 12 개월 무료 평가판에 가입 할 수 있습니다. 당신 의지 직불 카드 또는 신용 카드 정보를 입력해야하지만 프리 티어 FAQ에 따르면이 정보는 신원 확인에 사용되며 유료 계정으로 업그레이드하지 않으면 요금이 청구되지 않습니다.

다른 요구 사항은 AutoML 프로젝트에 대해 청구를 활성화해야한다는 것입니다. 무료 평가판 만 등록했거나 GPC 계정과 관련된 결제 정보가없는 경우 다음을 수행하십시오.

GCP 콘솔로 이동하십시오.
탐색 메뉴 (화면 왼쪽 상단 모서리에 줄이 그어진 아이콘)를 엽니 다.
'결제'를 선택하십시오.
'내 결제'드롭 다운 메뉴를 연 다음 '결제 계정 관리'를 엽니 다.
"계정 만들기"를 선택한 다음 화면의 지시에 따라 결제 프로필을 만듭니다.

새로운 GCP 프로젝트 만들기

이제 첫 번째 Cloud AutoML Vision 프로젝트를 만들 준비가되었습니다.

리소스 관리 페이지로 이동하십시오.
“프로젝트 생성”을 클릭하십시오.
프로젝트 이름을 지정한 다음 "만들기"를 클릭하십시오.

결제 계정이 여러 개인 경우 GCP는이 프로젝트와 연결할 계정을 묻습니다. 단일 결제 계정이있는 경우 과 결제 관리자 인 경우이 계정은 프로젝트에 자동으로 연결됩니다.

또는 결제 계정을 수동으로 선택할 수 있습니다.

GCP 콘솔의 탐색 메뉴를 연 다음 '결제'를 선택하십시오.
“결제 계정 연결”을 선택하십시오.
"계정 설정"을 선택한 다음이 프로젝트와 연결할 결제 계정을 선택하십시오.

Cloud AutoML 및 스토리지 API 사용

모델을 만들 때 모든 교육 이미지를 Cloud Storage 버킷에 저장하므로 AutoML을 활성화해야합니다 과 Google Cloud Storage API :

GCP 탐색 메뉴를 열고 "API 및 서비스> 대시 보드"를 선택하십시오.
"API 및 서비스 사용"을 클릭하십시오.
"Cloud AutoML API"를 입력 한 다음 표시되면 선택하십시오.
"사용"을 선택하십시오.
“API 및 서비스> 대시 보드> API 및 서비스 활성화”화면으로 돌아갑니다.
"Google Cloud Storage"를 입력하고 표시되면 선택하십시오.
"사용"을 선택하십시오.

Cloud Storage 버킷 생성

온라인 Linux 기반 가상 머신 인 Cloud Shell을 사용하여 Cloud Storage 버킷을 생성합니다.

헤더 바 (커서가 다음 스크린 샷에 위치)에서 "Google Cloud Shell 활성화"아이콘을 선택하십시오.

이제 Cloud Shell 세션이 콘솔 하단을 따라 열립니다. Google Cloud Shell이 프로젝트에 연결되는 동안 기다립니다.
다음 명령을 복사하여 Google Cloud Shell에 붙여 넣습니다.

PROJECT = $ (gcloud config get-value project) && BUCKET = "$ {PROJECT} -vcm"

키보드에서 "Enter"키를 누릅니다.
다음 명령을 복사하여 Google Cloud Shell에 붙여 넣습니다.

gsutil mb -p $ {PROJECT} -c 지역 -l us-central1 gs : // $ {BUCKET}

"Enter"키를 누르십시오.
다음 명령을 복사 / 붙여 넣기 한 다음 "Enter"키를 눌러 AutoML 서비스에 Google 클라우드 리소스에 액세스 할 수있는 권한을 부여하십시오.

PROJECT = $ (gcloud config get-value project) gcloud 프로젝트 add-iam-policy-binding $ PROJECT --member = "serviceAccount : [email protected]" --role = "roles / ml. admin "gcloud 프로젝트 add-iam-policy-binding $ PROJECT --member ="serviceAccount : [email protected] " --role ="roles / storage.admin "

훈련 시간 : 데이터 세트 구축

설정이 완료되면 이제 데이터 세트를 업로드 할 준비가되었습니다! 여기에는 다음이 포함됩니다.

빈 데이터 세트 만들기.
데이터 세트로 사진 가져 오기
각 사진에 하나 이상의 레이블을 지정합니다. AutoML Vision은 라벨이없는 사진을 완전히 무시합니다.

라벨링 과정을보다 쉽게하기 위해 고양이 사진을 다루기 전에 내 강아지 사진을 모두 업로드하고 라벨을 지정합니다.

AutoML Vision UI (문서 작성시 베타 버전)로 이동하십시오.
"새 데이터 세트"를 선택하십시오.
데이터 세트에 설명적인 이름을 지정하십시오.
"파일 선택"을 클릭하십시오.
다음 창에서 모든 개 사진을 선택한 다음 "열기"를 클릭하십시오.
이미지에 라벨이 두 개 이상 없으므로 "다중 라벨 분류 사용"을 선택하지 않은 상태로 둘 수 있습니다. "데이터 세트 생성"을 클릭하십시오.

업로드가 완료되면 Cloud AutoML Vision UI가 모든 이미지가 포함 된 화면으로 이동하고이 데이터 세트에 적용한 모든 레이블을 표시합니다.

현재 데이터 세트에 개 사진 만 포함되어 있기 때문에 일괄 적으로 라벨을 지정할 수 있습니다.

왼쪽 메뉴에서 "라벨 추가"를 선택하십시오.
"dog"을 입력 한 다음 키보드에서 "Enter"키를 누르십시오.
"모든 이미지 선택"을 클릭하십시오.
"라벨"드롭 다운을 열고 "개"를 선택하십시오.

이제 모든 개 사진에 라벨을 지정했습니다. 이제 고양이 사진으로 이동할 차례입니다.

헤더 바에서 "이미지 추가"를 선택하십시오.
"컴퓨터에서 업로드"를 선택하십시오.
모든 고양이 사진을 선택한 다음 "열기"를 클릭하십시오.
왼쪽 메뉴에서 "라벨 추가"를 선택하십시오.
"cat"을 입력 한 다음 키보드에서 "Enter"키를 누릅니다.
이미지 위로 마우스를 가져간 다음 작은 체크 표시 아이콘을 클릭하여 각 고양이 사진을 살펴보고 선택하십시오.
"라벨"드롭 다운을 열고 "고양이"를 선택하십시오.

머신 러닝 모델 교육

이제 데이터 세트가 준비되었으므로 이제 모델을 학습해야합니다. 당신은 하나를받습니다 계산하다 매월 최대 10 개의 모델에 대해 모델 당 1 시간의 무료 교육이 제공되며 이는 내부 컴퓨팅 사용량을 나타내므로 시계의 실제 시간과 관련이 없을 수 있습니다.

모델을 훈련 시키려면 간단히 :

AutoML Vision UI의 "Train"탭을 선택하십시오.
“훈련 시작”을 클릭하십시오.

Cloud AutoML Vision이 모델을 훈련시키는 데 걸리는 시간은 제공 한 데이터의 양에 따라 달라 지지만 공식 문서에 따르면 약 10 분이 소요됩니다. 모델 학습이 완료되면 Cloud AutoML Vision에서 모델을 자동으로 배포하고 모델을 사용할 준비가되었다는 이메일을 보냅니다.

모델이 얼마나 정확합니까?

모델을 테스트하기 전에 예측이 가능한 정확한지 확인하기 위해 약간의 조정이 필요할 수 있습니다.

"평가"탭을 선택한 다음 왼쪽 메뉴에서 필터 중 하나를 선택하십시오.

이 시점에서 AutoML Vision UI는이 레이블에 대한 다음 정보를 표시합니다.

점수 임계 값. 새 사진에 레이블을 할당하기 위해 모델이 가지고 있어야하는 신뢰 수준입니다. 이 슬라이더를 사용하면 함께 제공되는 정밀 리콜 그래프에서 결과를 모니터링하여 다양한 임계 값이 데이터 세트에 미치는 영향을 테스트 할 수 있습니다. 임계 값이 낮 으면 모델에서 더 많은 이미지를 분류하지만 사진을 잘못 식별 할 위험이 높아집니다. 임계 값이 높으면 모델에서 더 적은 수의 이미지를 분류하지만 더 적은 수의 이미지를 잘못 식별해야합니다.
평균 정밀도. 이는 1.0이 최대 점수 인 모든 점수 임계 값에서 모델의 성능을 나타냅니다.
정도. 정밀도가 높을수록 발생하는 오 탐지가 줄어 듭니다. 여기서 모델이 잘못된 레이블을 이미지에 적용합니다. 고정밀 모델은 가장 관련성이 높은 예제에만 레이블을 지정합니다.
회상. 레이블이 할당되어야하는 모든 예제 중에서 리콜은 실제로 레이블이 할당 된 수를 알려줍니다. 리콜 비율이 높을수록 발생하는 오탐이 줄어 듭니다. 여기서 모델이 이미지에 레이블을 지정하지 못합니다.

모델을 시험해보십시오!

이제 재미있는 부분이 있습니다. 이전에는 보지 못한 데이터를 기반으로 예측을 생성하여 모델에 사진에 개 또는 고양이가 포함되어 있는지 확인할 수 있는지 확인합니다.

그 사진을 잡아 아니었다 원래 데이터 세트에 포함되어 있습니다.
AutoML Vision Console에서 "Predict"탭을 선택하십시오.
"이미지 업로드"를 선택하십시오.
AutoML Vision에서 분석 할 이미지를 선택하십시오.
잠시 후 모델이 예측을 할 것입니다.

Cloud AutoML 비전이 베타 버전 인 경우 모델에 예열이 지연 될 수 있습니다. 요청이 오류를 반환하면 몇 초 후에 다시 시도하십시오.

마무리

이 기사에서는 Cloud AutoML Vision을 사용하여 맞춤형 학습 모델을 교육하고 배포하는 방법을 살펴 보았습니다. AutoML과 같은 도구를 사용하면 더 많은 사람들이 기계 학습을 사용할 수 있다고 생각하십니까? 아래 의견에 알려주십시오!

콘텐츠

데이터 세트 준비

Google Cloud Platform 무료 평가판 신청

새로운 GCP 프로젝트 만들기

Cloud AutoML 및 스토리지 API 사용

Cloud Storage 버킷 생성

훈련 시간 : 데이터 세트 구축

머신 러닝 모델 교육

모델이 얼마나 정확합니까?

모델을 시험해보십시오!

마무리

AlsterPlus :이 강력한 배터리 팩으로 모든 장치에 주스를 공급하십시오

보고서 : 미국의 Galaxy S10 첫 주 매출이 Galaxy S9보다 낫습니다.

RCS 메시징 해킹이 비활성화 된 것 같습니다 (업데이트 : 이제 다시 나타남)

RCS 메시징 : 왜 과장되지 않은가

ReactJS를 배우고 주요 프로그래밍 작업을 시작하십시오