philip Boltuzic,克罗地亚萨格勒布的开发者
Filip is available for hire
Hire Filip

菲利普Boltuzic

验证专家  in 工程

机器学习工程师和开发人员

Location
克罗地亚的萨格勒布
至今成员总数
2020年4月30日

Filip是一名拥有多年专业经验的机器学习工程师. 作为软件开发人员,他曾在亚马逊网络服务公司(Amazon Web服务)从事大规模问题的研究,并在萨格勒布大学(University of Zagreb)担任助理研究员,建立了自然语言处理模型. 菲利普的主要兴趣是机器学习和自然语言处理, 重点是建立文本分类模型.

Portfolio

在线自由职业机构
机器学习,监督机器学习,强化学习...
Aggieland软件公司
人工智能,机器学习,Azure机器学习...
PD4 Solutions LLC
人工智能,机器学习,Python...

Experience

Availability

Part-time

首选的环境

Java, Git, Linux, Docker, Apache Solr, Django, PyTorch, Pandas, NumPy, Scikit-learn, Python

最神奇的...

...我开发的机器学习模型是一个LSTM和CRF模型,用于将文本分割为论证性声明,这是我博士学位的一部分.D. thesis.

工作经验

研究顾问

2022年至今
在线自由职业机构
  • 调查、研究和记录软件中的缓存方法.
  • 复制了最流行的缓存方法来预测研究论文中的生存时间.
  • 建立了一个模拟器和强化学习模型,试图解决对象缓存的TTL预测问题.
Technologies: 机器学习,监督机器学习,强化学习, 深度强化学习, 数据科学, NumPy

AI和ML开发人员

2023 - 2023
Aggieland软件公司
  • 开发大型语言模型(LLM) LangChain bot生成软件需求.
  • 构建并部署到云上的多进程应用程序通过API公开,该API可以与用户聊天以生成软件需求.
  • 与两个团队合作,通过api集成LLM应用程序,提供web和移动应用程序访问LLM应用程序.
Technologies: 人工智能,机器学习,Azure机器学习, 大型语言模型(llm), Llama 2, FastAPI, LangChain

AI Expert

2023 - 2023
PD4 Solutions LLC
  • 开发了一个基于llm的解决方案,以确定哪些科学文章与用户输入的自由文本标准相关.
  • 评估了LLM解决方案的性能,并演示了证明比以前实现的解决方案有很大改进的指标.
  • 与机器学习工程师一起部署解决方案并定义应用LLM解决方案的最佳架构.
Technologies: 人工智能,机器学习,Python, 自然语言处理(NLP), 语言模型, 文本分类, 无监督学习, LangChain, 亚马逊网络服务(AWS), Git, GPT, 文本生成

高级数据科学家

2021 - 2023
Lionbridge自由撰稿人(通过Newfire Global Partners)
  • 在文本数据上开发了一个机器学习序列标注模型,达到0以上.9 F1 score.
  • 在不牺牲F1分数的情况下,减少了先前开发的机器学习模型的推理时间.
  • 使用PySpark和Databricks执行大规模的数据分析,公司使用这些数据来推动未来的业务决策.
  • 开发了多个高度可伸缩的Python web服务,这些服务目前正在为生产流量服务.
技术:Python, Agile, Scrum, Web服务, JSON, PyTorch, SpaCy, 自然语言工具包(NLTK), PySpark, Jupyter, Databricks, 开放神经网络交换(ONNX), 神经网络, LSTM, Pandas, 数据科学, NumPy, Git, 自然语言处理(NLP), 数据分析, Azure砖

数据科学工程师

2022 - 2022
BJS
  • 开发原型产品推荐,显示客户的购买模式.
  • 构建简单的AWS Lambda函数来执行ETL工作流.
  • Worked with PySpark on large sets of data (>100GB of historical purchases).
技术:Python, 机器学习, Spark ML, Scikit-learn, PySpark, 亚马逊网络服务(AWS), Git

机器学习工程师

2020 - 2021
Alchemy V Ltd(通过Toptal)
  • 使用拥抱脸转换器/文本生成管道和客户提供的数据创建了一个营销口号文本生成器.
  • 通过多个Google云服务BigQuery创建了一个数据摄取和报告流程, 云计算功能, 云终端, 和Dataproc.
  • 将现有的R报告代码移植到Python web服务中.
技术:Google Cloud, 谷歌云API, 谷歌BigQuery, R, Python, 文本生成, SQL, Git

自然语言处理顾问

2020 - 2021
格兰维尔知识管理(通过Toptal)
  • 开发了一个刮板下载一个大型(约20,000)和各种法律文件(1990年至今)从欧洲公共存储库.
  • 利用机器学习构建文本分类模型,实现基于文档内容的自动分类.
  • 创建了一个法律文件数据集,并使用它来训练和评估构建的机器学习文本分类模型. 通过谷歌协作共享结果,这样客户就可以用他们持有的数据交互地尝试模型的性能.
技术:Python, Scrapy, 网页抓取, PyTorch, Jupyter, 谷歌合作实验室(Colab), 文本分类, 自然语言处理(NLP)

研究助理

2018 - 2020
萨格勒布大学的实验室
  • 开发了克罗地亚法律文件的搜索引擎.
  • 结合LSTM和CRF,在PyTorch中构建了一个命名实体识别模型.
  • 指导过几个学生做实习项目,并撰写了自然语言处理方面的硕士论文.
技术:Scikit-learn, PyTorch, Apache Solr, Django, Python, Torch, Pandas, 数据科学, Git, 自然语言处理(NLP)

软件开发工程师

2014 - 2017
亚马逊网络服务(AWS)
  • 用Java和c++开发了一个可伸缩的时间序列数据库解决方案, 它每秒处理大约100万个请求.
  • 担任团队scrum主管和产品负责人.
  • 设计并实现了一个网络关联引擎微服务来处理来自整个亚马逊网络的网络事件(专利授予http://patents).justia.com/inventor/filip-boltuzic).
技术:亚马逊网络服务(AWS), C++, Python, Java, Algorithms, 编程, Agile, Git, Web服务

商业智能分析师

2012 - 2014
萨格勒巴卡联合信贷银行集团
  • 开发SQL报告,以确定数据仓库中有前景的零售策略.
  • 用Java构建了一个交互式工具,以加快Oracle Data Integrator中的流程.
  • 使用PL/SQL和Oracle Apex为会计部门开发小型web应用程序.
技术:Java, SQL,数据科学

克罗地亚法律文件搜索引擎

一个Django和Apache Solr web应用程序.

我是这个项目的首席开发人员,并提出了系统架构作为一组微服务. 文档在Solr中存储和索引, 而Django前端提供请求并与Solr通信.

零售额预测

该项目是设计一个基于历史订单数据预测销售数量的模型, 以前的销售, 和地区. 预测是在区域和全球一级进行的,并作为时间序列预测事项. 我尝试了几种时间序列预测技术,如ARIMA和SARIMA模型.

Other

自然语言处理(NLP), GPT, 生成预训练变压器(GPT), 人工智能(AI), 机器学习, Back-end, OpenAI GPT-3 API, 数据分析, Azure砖, 检索增强生成(RAG), 聚类算法, 聚类, 分类算法, 文本分类, Torch, 网页抓取, 谷歌合作实验室(Colab), 谷歌BigQuery, 文本生成, Web服务, 开放神经网络交换(ONNX), 神经网络, Research, 学生参与, 监督式机器学习, 时间序列, 自回归综合移动平均线(ARIMA), LangChain, OpenAI, 强化学习, 深度强化学习, Algorithms, 编程, Heuristics, 优化, 进化计算, 遗传算法, 卷积神经网络(CNN), 排序算法, 模式识别, 语言模型, 无监督学习, Big Data, 非结构化数据分析, 大型语言模型(llm), Llama 2, FastAPI, 提示工程, OpenAI GPT-4 API

Languages

Python, SQL, Haskell, Java, c++, R

库/ api

Scikit-learn, NumPy, Pandas, PyTorch, 谷歌云API, SpaCy, 自然语言工具包(NLTK), PySpark, LSTM, Spark ML

Tools

Vim文本编辑器,Solr, Apache Solr, Git, Oh My Zsh, Boto, Jupyter, LaTeX, Azure机器学习

Paradigms

数据科学、异常检测、敏捷、Scrum、商业智能(BI)

Platforms

亚马逊网络服务(AWS)、Linux、Docker、Databricks、SolrCloud

Frameworks

Django, Scrapy

Storage

Elasticsearch, Google Cloud, JSON

2012 - 2020

Ph.D. 自然语言处理专业

萨格勒布大学-萨格勒布,克罗地亚

2010 - 2012

计算机科学硕士学位

萨格勒布大学-萨格勒布,克罗地亚

2010 - 2011

伊拉斯谟计算机科学交流学习

KTH皇家理工学院-斯德哥尔摩,瑞典

2007 - 2010

计算机科学学士学位

萨格勒布大学-萨格勒布,克罗地亚

2017年11月至今

卷积神经网络

Coursera

有效的合作

如何使用Toptal

在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.

1

分享你的需求

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.
2

选择你的才能

在24小时内获得专业匹配人才的简短列表,以进行审查,面试和选择.
3

开始你的无风险人才试验

与你选择的人才一起工作,试用最多两周. 只有当你决定雇佣他们时才付钱.

对顶尖人才的需求很大.

开始招聘