Henrik Sergoyan,德国巴伐利亚州慕尼黑的开发人员
Henrik is available for hire
Hire Henrik

Henrik Sergoyan

Verified Expert  in Engineering

数据科学家和机器学习开发人员

Location
慕尼黑,巴伐利亚,德国
Toptal Member Since
November 5, 2021

Henrik是一位拥有超过六年专业经验的数据科学家. 他的主要专长包括但不限于自然语言处理, 预测算法, 表格数据的梯度增强算法, data scraping, 和机器学习操作(MLOps). 作为一名资深数据科学家, Henrik使用SQL和NoSQL数据库, including MongoDB, 并为他的工作带来了强大的项目管理技能和卓越.

Portfolio

Toptal Client
Python,数据科学,MongoDB, Jupyter Notebook, ETL,数据可视化...
车站赌场有限责任公司-主要
机器学习,SQL, Python, Linux, RapidMiner, Windows...
Fozzy Group
Python, PyCharm, MySQL,时间序列分析...

Experience

Availability

Part-time

Preferred Environment

Windows, MacOS, Slack, PyCharm, Jupyter Notebook, Visual Studio Code (VS Code)

The most amazing...

...我开发了一个端到端的数据科学管道,它适用于亚美尼亚政府使用的两个不同平台.

Work Experience

高级数据科学顾问

2022 - 2022
Toptal Client
  • 在MongoDB中开发复合聚合管道,以处理给定集合中的大量嵌套文档.
  • 创建了一个系统,可以识别数据处理阶段的错误,其中结构化信息来自慈善组织的PDF报告. 在我的系统的帮助下,我们可以检测并修复数据库中的所有不一致.
  • 创建了一个用户友好的流光仪表板(MVP),作为用户的慈善导航. 我为每个慈善机构开发了交互式可视化(桑基图),显示了全年的资金流动(从收入到支出).
Technologies: Python,数据科学,MongoDB, Jupyter Notebook, ETL,数据可视化, Streamlit, Data, Data Analysis, API Integration, Analytics, Database Management, 统计编程, Statistical Modeling, Sentiment Analysis

机器学习专家

2021 - 2022
车站赌场有限责任公司-主要
  • 开发了一个系统,可以识别将要离开大楼的客户(在15分钟的间隔内), 考虑到描述客户过去和当前行为的42个变量.
  • 开发复杂的SQL查询,从SQL数据库中提取实时数据.
  • 使用RapidMiner部署将模型留在生产环境中的机会.
Technologies: 机器学习,SQL, Python, Linux, RapidMiner, Windows, 渐变增强树, Deep Learning, Deep Neural Networks, Predictive Learning, Data, Data Analysis, API Integration, Data Science, Analytics, NoSQL, Database Management, 统计编程, Statistical Modeling, Sentiment Analysis

Senior Data Scientist

2021 - 2021
Fozzy Group
  • 创建并实施促销产品的销售预测模型.
  • 部署一个促销预测模型,并为该模型实施一个监控系统.
  • 协助改善乌克兰最大的杂货店推荐系统, 包括特征工程和建模.
  • 为销售预测模型创建了Power BI仪表板,以分析错误.
  • 通过与相关涉众沟通来确定业务需求,从而领导模型部署, 创建系统架构, 并协助后端团队以最优化的方式部署我们的模型.
Technologies: Python, PyCharm, MySQL,时间序列分析, 机器学习操作(MLOps), 推荐系统, Microsoft Power BI, LightGBM, CatBoost, XGBoost, Graylog, RabbitMQ, Flask, REST, Windows, Slack, Jupyter Notebook, Data Mining, Data Engineering, SQL, ETL, Machine Learning, 人工智能(AI), 数据科学产品经理, Azure SQL, Ensemble Methods, BERT, TensorFlow, Data Science, Deep Learning, Keras, Statistics, PySpark, 亚马逊网络服务(AWS), Dashboards, RStudio Shiny, Tableau, Predictive Learning, 渐变增强树, Reporting, Data Analytics, Data Analysis, Data Reporting, Web Scraping, Time Series, BigQuery, Statistical Analysis, Model Development, Pandas, PyTorch, Software Engineering, Mathematics, Data Visualization, Source Code Review, Task Analysis, Interviewing, Data, API Integration, Predictive Analytics, Analytics, NoSQL, Database Management, 统计编程, Statistical Modeling, Sentiment Analysis, NumPy

高级数据科学顾问

2019 - 2021
亚美尼亚国家可持续发展目标创新实验室|联合国开发计划署办事处
  • 开发了有史以来第一个人工智能驱动的实时工具travelinsights.数据分析,使用人工智能来收集数据, analyze, 并将Tripadvisor上关于亚美尼亚的旅游评论可视化, Facebook, and Booking.com.
  • 创建了实时平台Edu2Work,刮了60多个,000个在线欧博体育app下载, 从非结构化的职位描述中提取并标准化相关信息, 并在仪表板上显示分析结果.
  • 开发监控平台sdglab的数据科学部分.am/ zh /亚美尼亚可持续发展目标监测项目. 这是一个用户友好的、人工智能驱动的、开放访问的交互式在线数据分析工具.
  • 建立公民请求分类模型,提高亚美尼亚政府的运作效率, 将亚美尼亚公民提出的要求分配给相应的部委.
  • 管理一个数据科学团队. 从项目初期开始参与项目策划, 为每个任务制定了工作分解结构(WBS), 并管理数据科学团队和实验室主管之间的沟通.
Technologies: Python, GPT, 生成预训练变压器(GPT), 自然语言处理(NLP), TensorFlow, Google Cloud, BERT, Transformers, 零射击学习(ZSL), Few-shot Learning, Word2Vec, Clustering, GRAPH, FbProphet, CATS Forecasting, Ensemble Methods, Data Scraping, ETL, MongoDB, Selenium, Social Media APIs, Project Design, Design Thinking, 敏捷项目管理, Windows, MacOS, Slack, PyCharm, Jupyter Notebook, Data Mining, Unsupervised Learning, Data Engineering, 机器学习操作(MLOps), Machine Learning, 人工智能(AI), 数据科学产品经理, Data Science, 命名实体识别(NER), Deep Learning, Keras, Scikit-learn, Dashboards, RStudio Shiny, Linux, Predictive Learning, 渐变增强树, Deep Neural Networks, Reporting, Data Analytics, 谷歌云平台(GCP), Data Analysis, Data Reporting, Web Scraping, Time Series, Statistical Analysis, Model Development, Pandas, PyTorch, Software Engineering, Mathematics, Data Visualization, Technical Hiring, Code Review, Source Code Review, Task Analysis, Interviewing, Team Management, Data, API Integration, Predictive Analytics, Office 365, Analytics, NoSQL, Database Management, 统计编程, Statistical Modeling, Sentiment Analysis, NumPy

Teaching Associate

2019 - 2020
亚美尼亚美国大学
  • 指导一组高年级学生完成他们的Capstone项目,专注于亚美尼亚房地产市场分析. 开发数据提取模型, 室内设计分类, distance calculation, 以及最优的价格估计.
  • 每周与20名理学士和理学硕士一起解决统计学课程的问题. 根据所讨论的主题,解释了一组独特问题的解决方案.
  • 协助创建自然语言处理和统计学课程的教学大纲和议程.
  • 指导学生完成顶点项目, 一些与房地产市场相关的新闻分析.
技术:统计数据, Bayesian Statistics, 自然语言处理(NLP), GPT, 生成预训练变压器(GPT), University Teaching, Supervisor, Real Estate, Web Scraping, Data Collection, BigQuery, Statistical Analysis, PyTorch, Mathematics, Technical Hiring, Code Review, Task Analysis, Interviewing, Data, GIS, RStudio, Predictive Analytics, Office 365, Sports, Data Science, Analytics, NoSQL, Database Management, 统计编程, Sentiment Analysis, NumPy

Data Scientist

2018 - 2019
Ameriabank
  • 为银行员工创建并部署了一个基于人工智能的虚拟助手. 将银行内部沟通的操作效率降低了120%.
  • 开发金融市场指标、商品、价格和销售的预测算法.
  • 根据客户的交易和活动进行客户细分分析.
Technologies: Python, SQL, 自然语言处理(NLP), 生成预训练变压器(GPT), GPT, Windows, Slack, PyCharm, Jupyter Notebook, Data Mining, Data Scraping, Unsupervised Learning, Data Engineering, ETL, Machine Learning, 人工智能(AI), Ensemble Methods, 零射击学习(ZSL), BERT, TensorFlow, Google Cloud ML, Data Science, 命名实体识别(NER), Statistics, Bayesian Statistics, Scikit-learn, Dashboards, RStudio Shiny, Linux, Predictive Learning, 渐变增强树, Reporting, Data Analytics, 谷歌云平台(GCP), Sports, Data Analysis, Data Reporting, Web Scraping, Data Collection, Time Series, Statistical Analysis, Model Development, Pandas, Mathematics, Data Visualization, Code Review, Source Code Review, Task Analysis, Team Management, RStudio, Predictive Analytics, Office 365, Analytics, NoSQL, Database Management, 统计编程, Statistical Modeling, Sentiment Analysis, NumPy

数据科学家|统计学家

2017 - 2018
ClinChoice
  • 在数据库锁定之前准备SAS程序时发现数据集中的不一致.
  • 开发SAS程序生成表格, listings, 根据统计分析计划(SAP)中规定的规格绘制图表。.
  • Created, validated, 并根据适用的指导方针和客户的标准操作程序,通过良好的临床编程实践记录SAS程序.
Technologies: SAS, SAS SQL, Windows, Slack, Data Mining, ETL, Ensemble Methods, BERT, Bayesian Statistics, R, Predictive Learning, Reporting, Data Analytics, Data Analysis, Data Reporting, Web Scraping, Data Collection, Statistical Analysis, Pandas, RStudio, Predictive Analytics, Office 365, NoSQL, Database Management, 统计编程, Statistical Modeling, Sentiment Analysis, NumPy

劳动力市场信息平台| Edu2Work

http://edu2work.am/
Edu2Work平台的开发是为了应对劳动力市场的动态特性以及亚美尼亚人才需求和供应之间的持续不匹配. 该平台采用尖端的自然语言处理(NLP)模型来收集和分析来自一系列商业网站的数千个在线欧博体育app下载. By doing so, 它提供全面的, 亚美尼亚劳动力市场的最新数据, 使个人能够做出明智的职业决定.
Edu2Work的开发涉及到端到端的数据科学管道的设计和实现, 包含高效和灵活的数据摄取, 信息提取与标准化, and data visualization. 项目期间执行的核心NLP任务包括根据欧洲标准进行职称标准化, 行业分类, 技能提取和分类(软/硬), 和学位提取(BSc), MSc, PhD, None). 这些任务有助于使该平台能够以用户友好和可访问的格式提供高质量的劳动力市场数据.

促销预测

In this project, 我开发了一个端到端管道,用于预测乌克兰最大的零售商店促销产品的销售模型. 该模型考虑了30多个特征,以准确预测促销计划中产品的销售情况. 在内部部署之后, 该模型提高了商务团队决定促销类型和数量的操作效率, 后勤团队, 在每个分支机构分配足够的资源.

旅游分析平台

http://www.travelinsights.ai/
我为亚美尼亚的旅游业开发了一个人工智能实时数据分析工具. 这个在线工具使用旅行故事和人工智能来收集信息, analyze, 并将Tripadvisor上关于亚美尼亚的旅游评论可视化, Facebook, and Booking.com. 通过实时分析和可视化的游客评论, 该工具揭示了亚美尼亚的实际旅行偏好和实际问题. With one scroll, policymakers, businesses, 或者游客可以从世界各地探索亚美尼亚不同地区和地点的见解.
2022 - 2022

Ph.D. 数据科学学位

亚美尼亚欧洲大学-埃里温

2020 - 2022

数据科学数学硕士学位

慕尼黑工业大学-慕尼黑,德国

2019 - 2021

统计学硕士学位

埃里温州立大学-埃里温

2015 - 2019

计算机科学学士学位

亚美尼亚美国大学-埃里温,亚美尼亚

Libraries/APIs

CatBoost, XGBoost, Pandas, NumPy, TensorFlow, Keras, Scikit-learn, PyTorch, Social Media APIs, PySpark

Tools

Slack, PyCharm, 命名实体识别(NER), Visual Studio, Tableau, BigQuery, GIS, Microsoft Power BI, Graylog, RabbitMQ, Supervisor, AutoML

Frameworks

LightGBM, Selenium, RStudio Shiny, Flask, Streamlit

Languages

Python, R, SQL, SAS

Paradigms

ETL,数据科学,设计思维,敏捷项目管理,REST,自动化

Platforms

MacOS, Jupyter Notebook, RStudio, Windows, Linux, Azure, 亚马逊网络服务(AWS), 谷歌云平台(GCP), Visual Studio Code (VS Code), RapidMiner

Storage

数据库管理,MongoDB, MySQL, Google Cloud, SAS SQL, NoSQL, Azure SQL

Other

Data Mining, Data Scraping, 自然语言处理(NLP), Word2Vec, FbProphet, Ensemble Methods, Machine Learning, 人工智能(AI), Deep Learning, Statistics, Dashboards, 渐变增强树, Reporting, Data Analytics, Fantasy Sports, Data Analysis, Data Reporting, Web Scraping, Data Collection, Time Series, Statistical Analysis, Model Development, Mathematics, Data Visualization, Task Analysis, Interviewing, Data, Predictive Analytics, Sports, Football, Analytics, 统计编程, Statistical Modeling, Sentiment Analysis, GPT, 生成预训练变压器(GPT), Unsupervised Learning, Data Engineering, 计算统计数据, 机器学习操作(MLOps), Dash, Time Series Analysis, BERT, Transformers, 零射击学习(ZSL), Few-shot Learning, Project Design, 数据科学产品经理, Bayesian Statistics, Predictive Learning, Deep Neural Networks, University Teaching, Real Estate, Technical Hiring, Code Review, Source Code Review, Team Management, API Integration, Office 365, Google Cloud ML, 推荐系统, CATS Forecasting, Software Engineering, Agile Data Science, Graphs, Clustering, GRAPH, AppFolio

有效的合作

如何使用Toptal

在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.

1

Share your needs

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.
2

Choose your talent

在24小时内获得专业匹配人才的简短列表,以进行审查,面试和选择.
3

开始你的无风险人才试验

与你选择的人才一起工作,试用最多两周. 只有当你决定雇佣他们时才付钱.

对顶尖人才的需求很大.

Start hiring