Hệ thống chẩn đoán tự động của Tractian: Xử lý 340 triệu lượt suy luận AI mỗi ngày


Summary

Trong bài viết này, chúng ta sẽ khám phá hệ thống chẩn đoán tự động của Tractian, một công nghệ tiên tiến với khả năng xử lý khối lượng lớn suy luận AI. Điều này không chỉ mang lại những lợi ích to lớn cho doanh nghiệp mà còn mở ra nhiều cơ hội mới trong ngành công nghiệp 4.0. Key Points:

  • Tractian xử lý 340 triệu lượt suy luận AI mỗi ngày, thể hiện khả năng phân tích dữ liệu thời gian thực vượt trội.
  • Hệ thống cá nhân hóa dữ liệu đầu vào cho từng khách hàng, giúp tối ưu hóa quy trình bảo trì và giảm thiểu thời gian chết của thiết bị.
  • Kiến trúc hệ thống được thiết kế để hoạt động gần như tức thì, cho phép tích hợp linh hoạt với các nền tảng khác và nâng cao giá trị sử dụng.
Bài viết cung cấp cái nhìn sâu sắc về cách mà Tractian đang thay đổi cách thức bảo trì dự đoán thông qua việc ứng dụng trí tuệ nhân tạo mạnh mẽ.

Giới thiệu về Hệ thống sức khỏe công nghiệp Tractian

**Hệ Thống Chẩn Đoán Tự Động Của Tractian: Cách Chúng Tôi Xử Lý Hơn 340 Triệu Lượt Suy Luận Mô Hình Mỗi Ngày** - Phần 1

## Giới Thiệu
Tại Tractian, chúng tôi sở hữu một số lợi thế vượt trội so với các giải pháp khác trên thị trường: **phần cứng tự thiết kế, sản phẩm tích hợp toàn diện và chu kỳ cải tiến nhanh chóng**. Nhưng điều thực sự làm nên sự khác biệt chính là **Chẩn Đoán Tự Động™** - khả năng ứng dụng AI để **phân tích dữ liệu cảm biến theo thời gian thực và tự động phát hiện sự cố tiềm ẩn trước khi chúng trở nên nghiêm trọng**.

Trong loạt bài gồm ba phần này, chúng ta sẽ cùng khám phá **cách đội ngũ kỹ thuật của chúng tôi xây dựng một hệ thống có thể xử lý hơn 340 triệu lượt suy luận mô hình mỗi ngày**, quá trình phát triển nền tảng và những thách thức vẫn cần được giải quyết.

*Lưu ý: Hệ thống của chúng tôi không chỉ dừng lại ở việc thu thập dữ liệu từ cảm biến IoT mà còn tối ưu hóa độ chính xác nhờ các thuật toán AI tiên tiến, đồng thời cân nhắc cả yếu tố bền vững trong thiết kế phần cứng để giảm thiểu chi phí bảo trì về lâu dài.*

Dòng chảy dữ liệu tại Tractian

Trong bài viết đầu tiên này, chúng tôi sẽ giải thích chi tiết cách biến dữ liệu cảm biến thô thành thông tin hữu ích cho khách hàng. Bạn sẽ được theo chân quy trình xử lý dữ liệu của chúng tôi, từ khâu thu thập đến xử lý, cùng kiến trúc hệ thống được thiết kế để xử lý AI theo thời gian gần thực ở quy mô lớn.

## Dữ liệu "chảy" tại TRACTIAN thế nào?
Ở đây, chúng ta tập trung vào dữ liệu rung động từ cảm biến Smart Trac - nhưng thực tế dòng sản phẩm của chúng tôi còn bao gồm Energy Trac, Uni Trac và Omni Trac, những thiết bị giám sát đa dạng thông số của thiết bị công nghiệp.

Để tối ưu hóa dòng chảy dữ liệu, chúng tôi áp dụng thuật toán xử lý tiên tiến kết hợp học máy, đồng thời sử dụng cảm biến chất lượng cao nhằm đảm bảo độ chính xác. Mỗi dòng dữ liệu đầu vào đều được cá nhân hóa để hệ thống đưa ra phân tích sát với nhu cầu thực tế. Khả năng tích hợp linh hoạt với các nền tảng khác cũng góp phần làm phong phú thêm luồng dữ liệu, từ đó nâng cao hiệu quả chẩn đoán.
Extended Perspectives Comparison:
Kết luậnChi tiết
Linh hoạt trong mô hìnhCần xác định các thông số cụ thể cho từng thiết bị để đảm bảo hiệu quả khi phát hiện lỗi.
Bối cảnh hóa cảnh báoTổng hợp kết quả từ nhiều mô hình để ưu tiên các lỗi quan trọng nhất cho khách hàng.
Kiến trúc module SMDCho phép lắp ráp động các pipeline khác nhau, dễ dàng mở rộng và thích ứng với nguồn dữ liệu.
IHS RuntimeĐảm bảo tính ổn định và xử lý tự động sự kiện mà không làm gián đoạn hệ thống.
Thách thức về song song hóaCần cải thiện khả năng chạy đồng thời của các mô hình để tận dụng tài nguyên hiệu quả hơn.

Quá trình xử lý dữ liệu sau khi vào đám mây

Hành trình của Smart Trac bắt đầu ngay tại chính chiếc máy, nơi cảm biến thu thập các mẫu rung động. Vì không có kết nối internet trực tiếp (để tiết kiệm pin), nó sẽ gửi dữ liệu đến một bộ thu đóng vai trò như router, chuyển tiếp thông tin lên đám mây.

### Chuyện gì xảy ra khi dữ liệu lên tới đám mây?
- Hệ thống đầu tiên thực hiện phân loại, kiểm tra xem liệu dữ liệu có phải từ cảm biến Tractian không rồi định tuyến cho phù hợp.
- Toàn bộ quy trình xử lý hoạt động theo cơ chế bất đồng bộ và dựa trên sự kiện, nghĩa là mỗi hệ thống tự động xử lý dữ liệu độc lập rồi chuyển sang giai đoạn tiếp theo mà không cần phản hồi.

Bên cạnh đó, để tối ưu hóa hiệu suất, có thể áp dụng các thuật toán nén dữ liệu thông minh hoặc dùng machine learning để phân tích xu hướng. Việc mã hóa và xác thực đa lớp cũng giúp bảo mật thông tin tốt hơn. Nếu muốn xử lý lượng dữ liệu lớn hiệu quả, kiến trúc microservices là một lựa chọn không tồi.

Khung hệ thống của IHS và cách thức hoạt động


- Dữ liệu được **xử lý, nén, lưu trữ và biến đổi thành các đặc trưng** làm đầu vào cho các mô hình Machine Learning của chúng tôi. **Rốt cuộc chúng sẽ đi về đâu?** Đó chính là **IHS - Hệ thống Giám sát Công nghiệp**, nền tảng ML "cây nhà lá vườn" của chúng tôi.

## **Lõi hệ thống: IHS (Industrial Health System)**
IHS chính là **xương sống của hạ tầng học máy**, đảm nhiệm việc chạy các mô hình phát hiện lỗi ở quy mô lớn. Giống như toàn bộ kiến trúc hệ thống, **IHS vận hành theo cơ chế sự kiện** - mỗi sự kiện kích hoạt một chuỗi tác vụ xử lý liên hoàn.

Để tối ưu hóa hệ thống này, chúng tôi không ngừng cải tiến thuật toán học máy, tăng tốc xử lý dữ liệu và khả năng mở rộng. Việc tích hợp thêm các cảm biến IoT thông minh cũng giúp thu thập dữ liệu thời gian thực chính xác hơn, từ đó nâng cao độ "nhạy" của AI trong chẩn đoán sự cố.


Khung hệ thống của IHS và cách thức hoạt động Free Images


Số liệu ấn tượng từ Smart Trac và tác động đến hiệu suất

Để đặt mọi thứ vào đúng bối cảnh, chúng tôi hiện có hơn 100.000 cảm biến Smart Trac hoạt động trên thực địa, thu thập và truyền tải khoảng 11,5 triệu mẫu mỗi ngày - tức là gần 130 mẫu mỗi giây. Mặc dù con số 130 mẫu mỗi giây có thể không gây ấn tượng mạnh so với các tiêu chuẩn yêu cầu trên web, nhưng sự khác biệt chính là **mỗi mẫu phải trải qua nhiều mô hình Machine Learning**, điều này làm tăng đáng kể nhu cầu tính toán. Hơn nữa, một mẫu lại là một đối tượng phức tạp mang thông tin về độ rung của máy móc.

Trung bình, **mỗi mẫu được xử lý bởi khoảng 30 mô hình độc lập**, dẫn đến tổng cộng gần **3.900 lần suy luận mô hình mỗi giây**, hay xấp xỉ **345 triệu lần suy luận mỗi ngày**.

### **Xây dựng Kiến trúc Machine Learning Có Thể Mở Rộng**
Khi thiết kế hệ thống IHS, chúng tôi cần đảm bảo rằng nó phải:
1. **Bền vững** - Hệ thống phải tiếp tục hoạt động ngay cả khi một trong các mô hình gặp sự cố. Điều quan trọng nữa là khả năng quan sát để dễ dàng gỡ lỗi khi xảy ra lỗi.

Xây dựng kiến trúc máy học có thể mở rộng


2. **Linh hoạt** - Cần chọn động các mô hình khác nhau dựa trên đặc tính từng thiết bị. Ví dụ, mô hình phát hiện lỗi vòng bi yêu cầu thông số cụ thể (như đường kính vòng trong/vòng ngoài, số lượng con lăn). Nếu thiếu những thông số này thì mô hình không nên chạy.

3. **Bối cảnh hóa** - Do nhiều mô hình phân tích mỗi mẫu dữ liệu, cần có cách **tổng hợp kết quả và ưu tiên cảnh báo lỗi quan trọng nhất** cho khách hàng.

*Bổ sung từ tài liệu tham khảo:*
- Khi triển khai hệ thống phân tán, có thể cân nhắc dùng kỹ thuật tăng cường dữ liệu hoặc tối ưu hyperparameter (như learning rate) để phù hợp với đặc thù dữ liệu thiết bị.
- Một số trường hợp nên kết hợp cả DNN và cây quyết định để cân bằng giữa độ chính xác và tốc độ xử lý.

Các yêu cầu cần thiết cho hệ thống IHS

Những yêu cầu này đã dẫn chúng tôi đến việc phát triển **IHS với kiến trúc module**, được gọi nội bộ là SMD, được cấu trúc xoay quanh ba thành phần chính:
- **Chiến lược (S)** - Xác định các mô hình nào nên chạy dựa trên đặc điểm của dữ liệu.
- **Mô hình (M)** - Thực hiện các thuật toán học máy để phát hiện lỗi.
- **Bộ chẩn đoán (D)** - Tổng hợp kết quả từ các mô hình và quyết định xem có lỗi nào cần được báo cáo hay không.

Sự linh hoạt trong kiến trúc này cho phép chúng tôi **lắp ráp động** các **pipeline khác nhau** bằng cách sử dụng cùng các thành phần cốt lõi. Điều này không chỉ giúp hệ thống dễ dàng mở rộng mà còn đảm bảo khả năng thích ứng với các nguồn dữ liệu và nhu cầu thay đổi. Hơn nữa, việc phân chia rõ ràng giữa các thành phần giúp nâng cao hiệu quả xử lý và giảm thiểu thời gian phản hồi, đáp ứng các yêu cầu nghiêm ngặt về bảo mật và tính toàn vẹn của dữ liệu.

Kiến trúc mô-đun SMD của IHS

Toàn bộ hệ thống được điều phối bởi **IHS Runtime** - thành phần này hoạt động như sau:
- Luôn lắng nghe các sự kiện từ **topic Kafka**, nơi dữ liệu được truyền đến liên tục.
- Tự động xác định pipeline xử lý phù hợp cho từng loại sự kiện (có thể là mẫu dữ liệu, phản hồi khách hàng,...).
- Đặc biệt đảm bảo tính ổn định: dù một model nào đó gặp lỗi, **hệ thống vẫn chạy mượt mà không bị sập**.

Một số điểm bổ sung giúp hệ thống linh hoạt hơn:
1. **Xử lý song song**: Cơ chế phân luồng thông minh giúp xử lý nhiều sự kiện cùng lúc mà không bị nghẽn.
2. **Giám sát thời gian thực**: Theo dõi trạng thái từng pipeline để kịp thời phát hiện bất thường.
3. **Khả năng phục hồi**: Tự động khởi động lại các tiến trình bị lỗi mà không cần can thiệp thủ công.

Cách vận hành này giống như có một "người điều khiển giao thông" ảo, vừa đảm bảo lưu lượng dữ liệu chạy đúng hướng, vừa xử lý linh hoạt các tình huống phát sinh.
Kiến trúc mô-đun SMD của IHS

Cơ hội mở rộng và thách thức hiện tại của IHS

Trong bối cảnh IHS đã vận hành thành công trong môi trường thực tế hơn hai năm, chúng tôi đã nhận ra một số cơ hội cải thiện về khả năng mở rộng cần được giải quyết. Đầu tiên, vấn đề song song hóa (parallelism) là một thách thức lớn. Do kiến trúc nguyên khối của hệ thống và những hạn chế của Python trong việc thực thi song song, các mô hình hiện tại vẫn chạy tuần tự, mặc dù chúng hoàn toàn có thể hoạt động độc lập. Việc đạt được tính song song hoặc đồng thời (concurrency) hiện chỉ có thể thực hiện bằng cách nhân bản toàn bộ quy trình. Thứ hai, việc phân bổ tài nguyên cũng là một điểm cần cải thiện. Vì tất cả các mô hình đều chia sẻ chung một môi trường thực thi, các tài nguyên như GPU – vốn cần thiết để tăng tốc xử lý – phải được cấp phát liên tục, dù chỉ có một số ít mô hình thực sự sử dụng chúng. Điều này có thể dẫn đến lãng phí tài nguyên đáng kể. Ngoài ra, việc tích hợp công nghệ mới và nâng cao độ chính xác của hệ thống AI thông qua việc sử dụng dữ liệu chất lượng hơn cũng là những hướng đi tiềm năng. Đồng thời, việc đảm bảo bảo mật dữ liệu trong quá trình xử lý thông tin cũng cần được chú trọng để tăng cường niềm tin từ phía khách hàng.

Kế hoạch phát triển cho phiên bản IHS 2.0

Khi nói đến những thách thức trong quản lý phụ thuộc, một kịch bản tồi tệ có thể trở thành mặc định, dẫn đến hóa đơn đám mây cao hơn. Các mô hình cần phải chia sẻ cùng một thư viện phụ thuộc, điều này có thể gây ra các vấn đề tương thích khi cần cập nhật. Dù còn nhiều hạn chế, IHS đã đóng vai trò quan trọng trong sự thành công của Tractian; nó xử lý hàng trăm triệu suy luận Machine Learning mỗi ngày. Tuy nhiên, với số lượng cảm biến được triển khai ngày càng tăng, hệ thống của chúng tôi cần phải phát triển hơn nữa. Trong bài viết tiếp theo, chúng ta sẽ khám phá cách mà chúng tôi đã thiết kế lại IHS để vượt qua những giới hạn này và mở rộng quy mô lên phiên bản IHS 2.0.

Reference Articles

LUẬN ÁN TIẾN SĨ

- Phòng ngừa các bệnh thứ phát của hệ vận động, hệ hô hấp, hệ tim mạch…[8] ... Nghiên cứu tổng quan hệ thống của Farrokhi và cộng sự năm 2022 nhằm đánh ...

Source: tump.edu.vn

ĐẶT VẤN ĐỀ - Trường Đại học Y Hà Nội

Siêu âm B có giá trị chẩn đoán trong những trường hợp môi trường trong suốt của mắt bị vẩn đục không chụp được cắt lớp võng mạc và chụp mạch.

1. phác đồ điểu trị di chứng tổn thương thần kinh ngoại

TIÊU CHUẨN CHẨN ĐOÁN: 1. Lâm sàng: - Mất da nông không lộ gân xương thần ... - Phương pháp điều trị: đắp gạc sinh học để mô hạt tự tái tạo và tự lành vết thương.

Bé GI¸O DôC §µO T¹O

trong các hệ thống tự động hóa công nghiệp ngày nay. Sự tích hợp của một loạt các kỹ thuật chẩn đoán là một xu hướng để có được hiệu suất đơn giản và chẩn ...

Source: hpu.edu.vn

Hướng dẫn Ghi chép Phiếu chẩn đoán nguyên nhân tử vong ...

A. KHÁI NIỆM TỬ VONG VÀ NGUYÊN NHÂN TỬ VONG. 1. Tầm quan trọng của dữ liệu nguyên nhân tử vong: Dữ liệu về nguyên nhân tử vong (NNTV) là một phần không thể ...

Số tháng 03/2024

c|c tiêu chuẩn hệ thống quản lý của ISO đều có thể hỗ trợ việc thúc đẩy nhận thức v{ h{nh động cụ thể để bảo vệ môi trường, chống biến đổi khí hậu. Vì vậy ...

Source: TCVN

HIỂU CHO ĐÚNG CÁC THÔNG SỐ NƯỚC NỒI HƠI, CHẨN ĐOÁN ...

với mục đích giữ cho các thiết bị luôn ở tình trạng hoạt động tốt. Với yêu cầu sự hiểu biết thấu đáo về cấu tạo, nguyên lý hoạt động của các hệ thống động.


Lena Maier-Hein

Expert

Related Discussions

❖ Related Articles