Alex Burlacu,摩尔多瓦基希讷乌Chișinău开发者
Alex is available for hire
Hire Alex

Alex Burlacu

Verified Expert  in Engineering

机器学习开发人员

Location
Chișinău,基希讷乌,摩尔多瓦
Toptal Member Since
May 24, 2022

Over the years, 作为一个经验丰富的机器学习工程师, 亚历克斯处理各种各样的问题, 从计算机视觉到自然语言处理和时间序列预测. 他曾多次作为一名工程师参与这个项目, 尽管缺乏数据和计算资源, 别人失败的地方他成功了. 过去几年,他一直担任机器学习团队的负责人. 在业余时间,Alex喜欢从事独立演讲和ML研究.

Portfolio

Self-employed
Amazon EC2、Terraform、Ansible、Mistral AI、OpenAI、Azure...
Undetectable AI
PyTorch、人工智能、自然语言处理(NLP)...
ClearML
Python 3, PyTorch, ClearML, Amazon EC2, AWS CLI, Amazon S3 (AWS S3)...

Experience

Availability

Full-time

Preferred Environment

Ubuntu, Python 3, Visual Studio Code (VS Code), Git, Docker, PyTorch, Neural Networks

The most amazing...

...我做的是一个主动学习的多语言BERT模型,用于文档标记,以识别投标属性并加快文档处理速度.

Work Experience

ML/MLOps Consultant

2022 - PRESENT
Self-employed
  • 一家新闻公司的顾问, 帮助他们建立MLOps文化和流程,以可靠地重新训练他们的NLP模型. 使一组数据科学家能够使用法学硕士进行新闻摘要, news fact-checking, 合成数据生成.
  • 向高级数据科学家团队提供建议,通过软件优化和适当规模的组合优化其云计算成本,并迁移到简单的AWS, Azure, 以及内部部署云设置(用于批量推理和训练).
  • 使用GPT-4和dall - e3实现了一个多模态(视觉和文本)照片编辑应用程序. 该应用程序使用Docker部署在Google Cloud Run上.
  • 帮助一家初创公司为CNN微调调整其GCP虚拟机的大小. 使用Terraform和Ansible可靠发放虚拟机. 定义架构,以支持多模型放置在A100 gpu上进行培训,并使用Spot vm来提高成本效率.
技术:Amazon EC2、Terraform、Ansible、Mistral AI、OpenAI、Azure, 谷歌云平台(GCP), Cloud Run, GCP VMs, Llama 3, 卷积神经网络(CNN), Docker, 机器学习操作(MLOps), MLflow, 大型语言模型(llm), Prompt Engineering

NLP Expert

2023 - 2024
Undetectable AI
  • 为该项目开发了自定义的自托管LLM解决方案, 在AWS ECS上使用Terraform进行部署, 并使用vLLM优化了它在EC2 g5实例上的服务. 还开发了负载测试来评估、分析和优化推理堆栈.
  • 运行多个文本EDA分析, including POS tags, semantic coherence, n-grams, 以及文本可读性统计, 识别相关的结构和语义模式,我们随后使用这些模式来调整核心产品的性能.
  • 研究了非基于llm的解决方案和从文档中自动挖掘文本模式以进行文本增强,以创建产品的新迭代.
Technologies: PyTorch、人工智能、自然语言处理(NLP), Amazon SageMaker, OpenAI GPT-3 API, 图形处理器(GPU), Amazon EC2, Amazon弹性容器服务(Amazon ECS), 大型语言模型(llm), Terraform, OpenAI, 生成式人工智能(GenAI), Language Models, 亚马逊网络服务(AWS), Open-source LLMs, LLM Serving, Profiling, BERT, Prompt Engineering

Software Lead

2023 - 2024
ClearML
  • 领导clearpt项目的实施, 为企业培训和部署自托管llm的一组无代码工具. 在不同阶段积极塑造项目的设计和路线图, specifically MVP, demo, and customer PoC.
  • 在AWS G5实例上调整和部署多个基于llama和FLAN-T5的模型,以获得最佳性价比. 也与多gpu和多节点训练使用HuggingFace加速.
  • 构建工具来生成Q&来自文档页面的数据集, 一个支持rag的数据集生成管道, 还有一个定制的训练器,它会对表现最差的样本进行过度采样,以迫使模型更多地关注于提高难样本的表现.
  • 领导ClearML SDK团队,开发特性并确保包的开源和企业版本的及时发布. 积极参与未来版本特性的优先级排序和计划.
  • 参与社区和企业支持活动. 处理技术培训,并积极建议客户如何最好地利用ClearML来满足他们的MLOps需求,以及clearpt来满足他们的企业GenAI设置.
  • 调试了与数据集元数据管理相关的多个问题, pipelines API, 分布式法学硕士培训, 和环境跟踪的再现性.
  • 担任谷歌云相关问题的负责人. 帮助创建自定义机器映像并支持Spot实例. 为在GCP上运行ClearML的企业客户提供解决方案架构支持.
Technologies: Python 3, PyTorch, ClearML, Amazon EC2, AWS CLI, Amazon S3 (AWS S3), Multi-GPU Training, Machine Learning, 大型语言模型(llm), LLaMA, Flan-T5, Question Generation, Q&A Bots, 生成预训练变压器(GPT), Docker, Design Patterns, 检索增强生成(RAG), Python, Debugging, OpenAI GPT-3 API, 图形处理器(GPU), 生成式人工智能(GenAI), Language Models, Prompt Engineering, Fine-tuning, Data Synthesis, 人工智能(AI), 亚马逊网络服务(AWS), Generative AI, Open-source LLMs, 谷歌云平台(GCP)

机器学习团队负责人

2019 - 2022
DevelopmentAid
  • 在文档上使用机器学习(ML)和深度学习进行自然语言处理(NLP),使数据输入更高效.
  • 开发和生成多个ML微服务, 包括使用PyTorch和BERT通过命名实体识别对文档进行分类和标记, 另一个是利用scikit-learn处理不平衡的多输出文本分类.
  • 定义并编写了用于命名实体识别(NER)的快速数据注释和合成数据充实的程序. 将数据集大小从少量注释良好的文档增加到100多个.
  • 指导新机器学习模型的开发和实现实践,如机器学习代码审查, cross-validation, 以及可复制的实验.
  • 定义了一些MLOps实践,主要与使用Ray Serve的模型服务和使用MLflow的实验跟踪有关.
  • 建立可观察的基础设施,以减少未报告错误的数量,并将bug发现时间从几天缩短到大约10分钟. 使用机甲和ELK,帮助收养普罗米修斯和格拉凡纳.
  • 定义并记录部署过程,并将部署训练模型的时间减少到10分钟以内. 管理一个Jenkins实例,并使用Jenkins管道.
  • Established code reviews, 定期一对一会议, 明确的编码最佳实践, 以及像迭代计划这样的敏捷过程, planning poker, and standup meetings, 将功能周期时间减少5倍,每次迭代的新bug减少到0.3.
  • 自2020年7月起,领导由三名初级工程师组成的团队开发自动数据输入解决方案, 开发和部署新的ML模型, 处理我们的可观察性和CI基础设施.
技术:敏捷软件开发, Bash, Python 3, Docker, Docker Compose, PyTorch, RabbitMQ, Ray, Python, Flask, FastAPI, Jenkins, Jenkins Pipeline, Scikit-learn, Jaeger, Prometheus, Grafana, 机器学习操作(MLOps), 自然语言处理(NLP), 生成预训练变压器(GPT), GPT, Deep Learning, Transformers, MLflow, Team Mentoring, Machine Learning, Python 2, 人工智能(AI), JSON, Team Leadership, Pandas, Data Science, Hugging Face, BERT, Neural Networks, REST APIs, Fine-tuning, DevOps, 图形处理器(GPU), Language Models

Research Intern

2021 - 2021
巴黎北部索邦大学
  • 提高了深度学习算法的样本效率, 混合技术从自我监督, semi-supervised, 并且少镜头学习适用于图像和其他数据源.
  • 使用谷歌Colab笔记本电脑进行实验,然后切换到谷歌云平台. 配备了Terraform和Ansible, 使用一个bash命令在一到两分钟内创建图形处理单元(GPU)工作器和跟踪服务器.
  • 采用MLFlow进行实验跟踪,结合Papermill和Optuna进行超参数优化.
技术:自我监督学习, Terraform, Google Cloud, Ansible, Few-shot Learning, MLflow, Hyperparameter优化, Optuna, Python 3, Python, Machine Learning, 人工智能(AI), Computer Vision, 机器学习操作(MLOps), PyTorch, Deep Learning, Neural Networks, Fine-tuning, DevOps, 图形处理器(GPU), Research

University Assistant

2019 - 2021
摩尔多瓦技术大学
  • 重新创建并教授网络编程课程和两个专注于并发原语和网络协议的实验项目.
  • 撰写并讲授实时编程课程和三个涉及基于消息的并发性的实验项目, 包括演员模型和CSP, 以及面向消息的集成模式和协议,如MQTT和XMPP.
  • 全面检查和领导分布式系统和网络编程课程和实验室. 更新实时编程课程并讲授.
  • 涵盖了分布式系统课程中的各种主题, 比如数据处理系统, distributed databases, 微服务设计模式, 以及分布式系统的主要问题, like the consensus, time, 而且只送一次.
  • Mentored five final-year students for their semester project; two of them chose me as their bachelor thesis supervisor. 每学期领导40多名学生的实验室.
Technologies: Elixir, Python 3, HTTP, HTTP 2, 传输控制协议(TCP), RabbitMQ, Docker, Actor Model, Erlang, Scala, Message Queues, Parallel Programming, REST, HATEOAS, Mentorship, Distributed Systems, Microservices, Python, REST APIs

Summer Intern

2018 - 2018
Cern
  • 作为副合伙人参与EP-SFT小组, 获得英国科学技术设施委员会(STFC)的资助.
  • 开发了一个项目,针对针对高能物理(HEP)的多层感知器,对TMVA包针对TensorFlow的逐事件推理性能进行基准测试。.
  • 搜索ROOT科学包的TMVA子包的瓶颈和未来优化方向.
  • Concluded that, for one-by-one and small batch (< 32) inference modes, TMVA比TensorFlow 1快两个数量级.8、使用c++推理API从启用AVX512的源代码构建.
  • 在布加勒斯特EEML 2019暑期学校的一次会议上展示了关于这项工作的海报.
Technologies: C++, Bash, Docker, ROOT, TensorFlow, Keras, Bazel, Python 3, Python, Machine Learning, Deep Learning, Neural Networks

机器学习工程师

2017 - 2018
Redox Entertainment
  • 研究开发用于体外受精卵母细胞医学图像分析的神经网络. 使用自动编码器预训练和自监督学习的连体网络等技术,创建了十多个定制的神经网络架构.
  • 指导并培养了一位博士.D. 实习三个月后成为团队一员,也参与深度学习相关项目.
  • 为小型企业开发了专门的体系结构, 低方差医学图像数据集,其性能与谷歌的AutoML Vision相当.
  • 调试了一个预处理数据问题,泄漏了测试集,错误地在评估过程中给出了非常高的准确性. 防止发布损坏的模型,从而挽救了公司的声誉.
Technologies: Bash, TensorFlow, Docker, Keras, Scikit-image, Computer Vision, Self-supervised学习, Deep Learning, Machine Learning, Medical Imaging, Team Mentoring, Python 3, Python, OpenCV, 人工智能(AI), Image Processing, SQL, Data Science, Neural Networks, Fine-tuning, 图形处理器(GPU), Research, Google Cloud AutoML

Co-founder and CTO

2017 - 2017
BookVoyager
  • 开发基于搜索和内容的小说推荐系统,从原始文本中提取特征,并根据这些特征提供推荐.
  • 实现日志记录,以便更快地进行故障排除,并将体系结构定义为多服务系统.
  • 利用SpaCy构建了基于令牌级和全文分析的特征提取和推荐子系统.
  • 参与客户访谈, 定义了业务和开发过程, 并在不同的场所推销这个项目.
  • 通过使用预分配数组将推荐结果的计算速度提高85倍,并使用性能分析来识别瓶颈.
Technologies: Python 3, Python, Unit Testing, SpaCy, Scikit-learn, MongoDB, Flask, REST, XML-RPC, Git, Sentiment Analysis, GPT, 生成预训练变压器(GPT), 自然语言处理(NLP), JSON, REST APIs

Serverless Platform

我从零开始设计并实现了一个无服务器平台, 一个使用Python的AWS Lambda, FastAPI, and Docker. With Vue.js中,我为它编写了一个基本的UI. 该平台允许在Docker容器中创建和运行任意Python代码.

以丰富其功能, 我添加了一些其他服务,比如RabbitMQ, Minio, PostgresSQL, MongoDB, and Apache Tika. To make it easier to use, 我编写了一个类似API网关的服务, TCP服务器将HTTP请求转换为消息,并将响应作为HTTP响应发送回调用方.

这个项目后来成为一门独立讲授的分布式系统设计课程的基础. 这是一门免费课程,有25名学生参加,其中11人获得结业证书.

亚历克斯的偶尔博客文章|个人博客

http://alexandruburlacu.github.io
In my personal blog, hosted on GitHub, 我主要写关于高级机器学习和深度学习技术的文章, 还包括我所掌握的一些重要知识, like distributed systems, elixir language, 并发性和并行性, 以及与高级工程师和团队领导相关的主题.

我用杰基尔创造了它, 自定义一些模板, 并增加了谷歌分析和谷歌标签管理器.

用于人工智能研究的轻量级MLOps模板

一套工具,用于加快在云基础设施上运行和跟踪多个DL/AI实验的过程, 特别调优了spot实例,以降低模型迭代的总体成本. 为了使该工具易于与Jupyter一起使用,它具有自定义的MLFlow日志记录. 它使用Papermill和Optuna的组合,以最小的调整在Jupyter笔记本上运行超参数优化.

摩尔多瓦国家Python和人工智能课程

http://mecc.gov.md/sites/default/files/curriculum_ia_aprobat_cnc.pdf
我是为高中生开发国家人工智能课程的小组协调员. As part of the effort, 我们形成了课程的结构,使其对高中生有吸引力. 我用罗马尼亚语制作了包括14门课程笔记和练习笔记本在内的教育材料. As part of the course, 学生将了解人工智能的主要应用, 简要了解计算机视觉和自然语言处理的人工智能, 然后学习主要的机器学习算法, 然后是线性代数的基础知识和探索性数据分析. Finally, 人工智能的各种社会和非技术方面包括围绕自动驾驶汽车的法律和社会问题, deep fakes, 人脸识别技术, and LLMs.
2019 - 2021

计算机科学硕士学位

斯特凡塞尔马雷大学- Suceava,罗马尼亚

2019 - 2021

计算机科学硕士学位

摩尔多瓦技术大学基希讷乌,摩尔多瓦

2015 - 2019

计算机科学学士学位

摩尔多瓦技术大学基希讷乌,摩尔多瓦

2022年12月- 2024年12月

谷歌云认证专业机器学习工程师

Google Cloud

2022年12月- 2024年12月

谷歌云认证专业云架构师

Google Cloud

JUNE 2022 - JUNE 2025

认证Kubernetes应用开发人员(CKAD)

云原生计算基金会(CNCF)

JUNE 2022 - PRESENT

Deep Learning Engineer

Workera

Libraries/APIs

Scikit-learn, REST api, PyTorch, TensorFlow, Jenkins Pipeline, Pandas, Keras, Vue, OpenCV, SpaCy

Tools

Git, Docker Compose, RabbitMQ, Jekyll, Google Analytics, Jenkins, Grafana, Scikit-image, Terraform, Ansible, Bazel, Helm, BigQuery, AWS CLI, Amazon弹性容器服务(Amazon ECS), Amazon SageMaker

Languages

Python 3, Python, Elixir, Bash, SQL, c++, C, Python 2, Lisp, HTML, CSS, Java 8, Erlang, Scala

Paradigms

REST,数据科学,函数式编程,DevOps,单元测试,面向对象分析 & Design (OOAD), 面向对象编程(OOP), 敏捷软件开发, Serverless Architecture, Parallel Programming, Actor Model, Microservices, Design Patterns

Platforms

Docker, ClearML, Ubuntu, Amazon EC2, 亚马逊网络服务(AWS), Kubernetes, Jupyter Notebook, 谷歌云平台(GCP), Visual Studio Code (VS Code), Azure, Cloud Run

Storage

JSON, Google Cloud, MongoDB, XML-RPC, PostgreSQL, Amazon S3 (AWS S3)

Frameworks

Flask

Other

Deep Learning, Machine Learning, 机器学习操作(MLOps), 自然语言处理(NLP), 人工智能(AI), BERT, Neural Networks, GPT, 生成预训练变压器(GPT), Fine-tuning, 大型语言模型(llm), Language Models, University Teaching, Team Mentoring, FastAPI, Self-supervised学习, Computer Vision, Team Leadership, Hugging Face, 图形处理器(GPU), 生成式人工智能(GenAI), Prompt Engineering, Data Synthesis, Generative AI, OpenAI, Open-source LLMs, Cloud, Distributed Systems, Cloud Computing, MinIO, Serverless, 传输控制协议(TCP), HTTP, Coding, HATEOAS, Ray, Jaeger, Prometheus, Transformers, MLflow, Medical Imaging, Few-shot Learning, Hyperparameter优化, Optuna, ROOT, HTTP 2, Message Queues, Mentorship, Image Processing, Sentiment Analysis, Kustomize, Data Engineering, Multi-GPU Training, LLaMA, Flan-T5, Question Generation, Q&A Bots, 检索增强生成(RAG), OpenAI GPT-3 API, Debugging, Research, Mistral AI, GCP VMs, Google Cloud AutoML, Llama 3, 卷积神经网络(CNN), LLM Serving, Profiling

Collaboration That Works

How to Work with Toptal

在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.

1

Share your needs

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.
2

Choose your talent

在24小时内获得专业匹配人才的简短列表,以进行审查,面试和选择.
3

开始你的无风险人才试验

与你选择的人才一起工作,试用最多两周. 只有当你决定雇佣他们时才付钱.

对顶尖人才的需求很大.

Start hiring