Skip to main content

[쿠팡PriceTech] Senior, Data Engineer - Pricing text mapping, ES

Location Seoul, South Korea
Updated

Description

쿠팡은 세계에서 가장 빠르고 크게 성장하는 Ecommerce 기업입니다.  우리는 고객, 직원, 파트너 그리고 우리를 둘러싼 모든 사람들의 일상을 어떻게 혁신할 수 있을지 매 순간 고민합니다. 우리는 아직 아무도 풀지 못한 문제를 해결함으로써 사람들이 이렇게 묻는 세상을 만들고자 합니다. “쿠팡 없이 어떻게 살았을까?” 쿠팡은 서울뿐만 아니라 베이징, LA, 시애틀, 상하이와 실리콘밸리 등에 오피스를 두고 있는 글로벌 기업입니다.

직무 개요:

쿠팡에서 판매하는 상품은 수백만개에 이르며, 다수의 판매자들이 다양한 상품을 판매하고 있습니다. 상품의 타이틀은 고객들에게 상품의 다양한 특징과 정보를 전달할 수 있는 가장 직접적인 수단입니다. 또한 상품 타이틀은 상품의 특징을 구분할 수 있는 속성 정보를 포함하고 있으며, 이 속성 정보들은 상품 관리 및 가격 정책 수립에 있어 핵심적인 요소로 사용되고 있습니다. Pricing text mapping, ES의 데이터 사이언티스트는 상품의 다양한 텍스트 정보를 분석하여 중요한 속성 정보를 추출하고, 데이터 마이닝, 통계적 분석 등을 통해 다양한 비즈니스 인사이트를 발굴 합니다. 또한 다양한 목표를 가지고 있는 비즈니스 문제 해결을 위해 머신 러닝, 최적화 모델 등을 구축하여 의사 결정을 지원합니다.

주요 업무 내용:

· 상품의 타이틀 정보를 이용하여 특정 상품과 동일하거나 매우 유사한 상품을 찾을 수 있는 서비스 환경을 구축하고 유지보수 한다.

· 상품을 구분할 수 있는 유의미한 속성을 정의하고, 이를 정확하게 추출할 수 있는 메타 데이터를 구축, 관리한다.

· 상품 타이틀에서 유추할 수 있는 다양한 정보를 추출하고 전사적으로 제공한다.

· 유사 상품 검색을 위한 Elastic search 서비스를 관리한다.

· 텍스트 매핑 서비스 상의 모든 오류를 감지하고 모니터링 및 alert을 주는 시스템을 개발/관리한다.

· 텍스트 매핑 서비스에서 사용하는 메타 데이터 관리 툴을 개발/관리한다.

자격 요건:

· 컴퓨터 과학 관련 분야에 대한 학사 이상의 학위 소유자

· 5년 이상의 데이터 엔지니어링 또는 백엔드 서비스 경험자

· Java, Python 프로그래밍 가능자

· Spring frame work를 이용한 서비스 개발 경험자

· 방대한 규모의 데이터를 조작, 알고리즘/모델 개발에 필요한 Python/R/SQL/Spark 에 대한 프로그래밍 경험을 보유한 자

· 뛰어난 분석, 문제 해결 능력을 보유한 자

· 팀원들과 협력할 수 있으며 스스로 동기부여할 수 있고 ‘할 수 있다’는 자세로 임하는 자

· 빠르게 변하는 환경속에서 새로운 기술을 배우고 기한을 맞출 수 있는 능력을 갖춘 자

우대 요건 :

· Hive, Spark 와 같은 분산 데이터 컴퓨팅 툴에 대한 지식과 경험을 보유한 자

· AWS / 클라우드 시스템, Hive 등 분산 처리 시스템 경험자

· Elastic search 등 검색 기술 관련 경험자

 

 


Coupang is one of the largest and fastest growing e-commerce platforms on the planet. We are on a mission to revolutionize everyday lives for our customers, employees and partners. We solve problems no one has solved before to create a world where people ask, "How did we ever live without Coupang?" Coupang is a global company with offices in Beijing, Los Angeles, Seattle, Seoul, Shanghai, and Silicon Valley.

Job Overview:

Coupang is one of the largest ecommerce platform where millions of products are available and a large number of sellers offer a wide range of products. Product titles are the most direct means of communicating various kinds of information and features of a product to customers. Product titles also include attributes that can help identify the properties of a product. Attributes are a key factor in managing product catalog and creating pricing policy. Data Scientist at Pricing Text Mapping/ES analyze the text information of product to extract important attributes and draw business insights from data mining and statistical analysis. And Data Scientist also supports decision making by building ML and optimization model to solve business problems and achieve goals.

Key Responsibilities:

· Build and maintain a service environment to identify matching or similar products by using product titles.

· Determine attributes that can define products Build and manage metadata to extract the right attributes.

· Extract various kinds of information from product titles and provide the data for different teams and stakeholders across the company

· Manages the Elastic search service for searching similar products.

· Develop/manage a system that detects errors in the text mapping service and send out monitoring alerts.

· Develop/manage metadata management tools used for text mapping service.

Basic Qualifications:

· Minimum Bachelor’s degree level qualification or equivalent in Computer Science or related fields

· 5+ years of work experience in data engineering or backend service

· Hands-on programming experience with Java or Python

· Experience with spring framework to develop a service

· Programming experience in Python /R/SQL/Spark to manipulate huge amounts of data and develop algorithms/models

· Strong analytical and problem-solving skills

· Team player with a self-motivated and "CAN-DO" attitude

· Ability to learn new techniques, and meet deadlines in a fast-moving environment

Preferred Qualifications:

· Knowledge and experience in distributed data/computing tools such as Hive and Spark

· Experience in distributed processing systems such as AWS / cloud systems and Hive

· Experience with search engines including Elastic Search


Apply now