iterrows를 활용한 빈 리스트에 결과값 채워넣기

데이터 과학

by Taeyoon.Kim.DS 2023. 12. 7. 00:48

import pandas as pd

self.prediction_data = pd.DataFrame({
    'ocr_score': [...],  # OCR 점수 데이터
    'logo_score': [...],  # 로고 탐지 점수 데이터
    'image_score': [...],  # 이미지 점수 데이터
    # 필요한 다른 컬럼들...
})

먼저 각 점수가 데이터 프레임에 존재한다고 가정한다.

self.prediction_data['custom_tag'] = [[] for _ in range(len(self.prediction_data))]

데이터프레임에 새로운 컬럼인 'custom_tag'를 생성하고, 데이터프레임의 전체 row의 수만큼 list comprehension을 통해서 빈 리스트를 각 행에 생성해준다.

def classify_trademark_prediction_OCR(self):
    if self.delphic_script_feature_exists:
        for idx, row in self.prediction_data.iterrows():
            if row['ocr_score'] > self.ocr_trademark_score and row['image_score'] > 40:
                row['custom_tag'].append("AI-text in image")

iterrows()메서드가 반환하는 각 튜플을 순회한다. idx는 각 행의 인덱스를, row는 해당 행의 데이터를 나타내는 시리즈 객체를 받는다. idx가 있어서 각 행의 인덱스를 찾고, row는 해당 행의 데이터를 나타내는 시리즈 객체를 받는다.

이제 두 조건을 합쳐주면 더 쉽게 처리된다.

self.prediction_data['custom_tag'] = [[] for _ in range(len(self.prediction_data))]

for idx, row in self.prediction_data.iterrows():
    if self.delphic_script_feature_exists and row['ocr_score'] > self.ocr_trademark_score and row['image_score'] > 40:
        row['custom_tag'].append("AI-text in image")

    if self.logo_model_exists and row['logo_score'] > self.logo_trademark_score and row['image_score'] > 40:
        row['custom_tag'].append("AI-logo in image")

저작자표시 비영리 변경금지

'데이터 과학' 카테고리의 다른 글

MLOps인프라와 도구 (Container) (0)	2024.01.03
ML LifeCycle (0)	2023.12.27
Graph Data Model - AWS Neptune Graph DB (0)	2023.12.06
Data Prep (Class Imbalance) (1)	2023.12.06
[패스트 캠퍼스] 10개 프로젝트로 한 번에 끝내는 MLOps 파이프라인 구현 (실습4) (0)	2023.12.04

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

Taeyoon.Kim.DS

고정 헤더 영역

메뉴 레이어

메뉴 리스트

검색 레이어

검색 영역

상세 컨텐츠

본문 제목

본문

'데이터 과학' 카테고리의 다른 글

관련글 더보기

추가 정보

인기글

최신글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역