Bí ẩn về hai GPU Intel Arc mới với 10 và 12 lõi Xe - Liệu đây có phải là Battlemage?

Bí ẩn về hai GPU Intel Arc mới với 10 và 12 lõi Xe - Liệu đây có phải là Battlemage?

Tùy thuộc vào thông số kỹ thuật cuối cùng, hiệu suất tiềm năng có vẻ đầy hứa hẹn.

  •  

Một cặp danh sách điểm chuẩn của SiSoftware đã tiết lộ hai GPU Intel mới có lõi Xe 10 và 12 , với 12GB VRAM trên cả hai kết quả. Có thể hai GPU này là card đồ họa Battlemage trong tương lai, mặc dù tốc độ xung nhịp tương đối thấp và số lượng lõi hạn chế vẫn còn chỗ để tranh luận. Chúng cũng có thể là các cấu hình Nhà giả kim thay thế, danh sách giả mạo hoặc thậm chí là các giải pháp đồ họa tích hợp tiềm năng. Nhưng hãy nói về những gì chúng ta biết bây giờ.

Battlemage là phiên bản kế nhiệm sắp tới của Arc Alchemist sẽ nhắm đến thị trường card đồ họa chuyên dụng. Nó cũng sẽ được sử dụng như một giải pháp đồ họa tích hợp trong tương lai cho các kiến ​​trúc CPU trong tương lai của Intel (bao gồm cả Lunar Lake ). Intel được đồn đại là đang nhắm mục tiêu ngày phát hành vào quý 3 năm 2024, điều này sẽ phù hợp với khả năng rò rỉ Battlemage.

Theo danh sách của SiSoftware, thông số kỹ thuật của cả hai GPU dường như không mấy ấn tượng. Các môn thể thao cung cấp ít mạnh nhất chỉ có 1440 ALU đổ bóng, trong khi SKU mạnh hơn có 1728 ALU đổ bóng. Để so sánh điều đó, Arc A580 có 3456 bộ đổ bóng, trong khi Arc A380 cắt giảm con số đó xuống còn 1024 bộ đổ bóng. Nhưng có một số điều tò mò khác để thảo luận. Tùy thuộc vào số lượng bộ đổ bóng trong mỗi lõi Xe, chúng tôi sẽ có 10 và 12 lõi Xe hoặc có thể là 20 và 24 lõi Xe. Câu trả lời nào đúng là vấn đề khá quan trọng, như chúng ta sẽ thảo luận dưới đây.

Tốc độ xung nhịp cũng thấp một cách không mấy ấn tượng, chỉ 1,8 GHz, phải thừa nhận rằng điều này có thể là do các thử nghiệm trình điều khiển và silicon ban đầu. Thông số kỹ thuật cao hơn một chút là cả hai đều có 12GB VRAM, tốt hơn so với 8GB trên GPU tầm trung A580 và A750. Tuy nhiên, những chiếc card đó sử dụng chip 1GB với giao diện 256-bit nên vẫn có khả năng đây là những chiếc Alchemist, chỉ cấu hình với chip 2GB và giao diện 192-bit.

Và sau đó là bộ đệm L2 8MB. Đó là một con số hơi kỳ lạ đối với thẻ 12 GB, vì GPU Alchemist của Intel có 4 MB hoặc 2 MB cho mỗi bộ điều khiển 64 bit. Cả A750 và A770 đều có 16 MB bộ đệm L2 trong khi A580 có 8 MB, nhưng không rõ làm thế nào các chip có giao diện 192 bit có thể đạt được tổng bộ đệm 8 MB - dường như không có khả năng đạt được 2,67 MB cho mỗi giao diện 64 bit, và lượng L2 nhỏ như vậy cũng không có nhiều ý nghĩa đối với kiến ​​trúc Battlemage trong tương lai. Tất nhiên, bộ đệm L2 có thể được tách rời khỏi giao diện bộ nhớ và Intel có thể có bộ đệm L3 không hiển thị trong các kết quả "bị rò rỉ" này, nhưng chúng tôi không biết chắc chắn.

So với các GPU Arc Alchemist hiện có của Intel, hai GPU này có số lượng lõi đổ bóng khá thấp — nhiều hơn Arc A380 nhưng ít hơn nhiều so với Arc A580. Cũng lưu ý rằng chúng tôi không thể loại trừ khả năng đây là những con chip di động đời đầu dành cho mục đích thử nghiệm và gỡ lỗi. Hệ thống được sử dụng hiển thị bo mạch chủ Intel Z790 nhưng có thể kiểm tra GPU di động bằng máy tính để bàn nếu những rò rỉ này đến từ phòng thí nghiệm phần cứng.

Về mặt định vị, đây dường như là những giải pháp đồ họa tầm trung phù hợp túi tiền, dựa trên số lượng Xe-core được cho là. Chúng tôi cũng chấp nhận dữ liệu được báo cáo của SiSoftware theo mệnh giá, trong đó liệt kê "công suất" 160 CU và 192 CU với 1440 và 1728 "bộ đổ bóng". Intel không sử dụng CU hoặc Đơn vị tính toán cho GPU của mình, như AMD, trong khi Nvidia sử dụng "Bộ xử lý đa luồng phát trực tuyến", nhưng SiSoftware sử dụng cùng nhãn CU cho cả ba. Các GPU Intel này dường như đang sử dụng "CU nhân chín" cho các số liệu đổ bóng, với số CU cơ sở gấp 16 lần số lượng Xe-core — hoặc nếu bạn muốn theo trường phái cũ, thì đó là số lượng Đơn vị thực thi từ các GPU Intel cũ hơn .

Trong suốt như bùn? Hãy đưa ra một ví dụ cụ thể hơn với cấu hình GPU đã biết. Danh sách Arc A380 này cho biết 128 CU và 1152S. Arc A380 thực tế có tám lõi Xe với 1024 ALU đổ bóng trải rộng trên mười sáu Động cơ Vector (trước đây gọi là Đơn vị thực thi) trên mỗi lõi Xe. Ngoài ra còn có thêm một ALU "mục đích đặc biệt" (toán học mở rộng) cho mỗi Công cụ Vector. Vì vậy, 8 * 16 * 9 = 1152 ALU đổ bóng. Nhưng những tính toán tương tự từ SiSoftware dường như không áp dụng cho các GPU dòng Arc A lớn hơn vì bất kỳ lý do gì (chúng sử dụng Xe-core * 16 * 8, không tính đến ALU toán học mở rộng). Đây là cách mọi thứ bị phá vỡ:

So sánh GPU Intel SiSoftware
GPUĐiểm SiSoftALU ShaderKý ứcBộ đệm L2
Không rõ 10 (?) Xe-core6.030,66Mpix/giây144012GB8MB
Không rõ 12 (?) Xe-core7.231,20Mpix/giây172812GB8MB
Vòng cung A3802.115,73Mpix/giây11526GB4 MB
Vòng cung A5806.121,41Mpix/giây34568GB8MB
Vòng cung A7507.144,78Mpix/giây35848GB16 MB
Vòng cung A7708.228,81Mpix/giây409616GB16 MB
 

Hiện tại, dữ liệu hiệu suất không thực sự hữu ích vì chúng tôi không chắc chắn về một số thông số kỹ thuật và mức độ Battlemage có thể đạt được. Cấu hình cốt lõi và tốc độ xung nhịp cho thấy hiệu suất sẽ tốt hơn A380 - và đúng như vậy. Có vẻ như Intel đang nhận được hiệu suất cao hơn nhiều nhờ ít bộ đổ bóng hơn với các GPU chưa xác định này.

Để so sánh, kết quả Arc A580 OpenCL là 6.121Mpix/s gần giống với kết quả 6.031Mpix/s của chip Xe-core 10 (hoặc 20?) chưa biết, nhưng A580 có 24 lõi Xe. Và đây là Arc A750 OpenCL nhận được 7.145Mpix/s trong khi kết quả Arc A770 OpenCL này là 8.229Mpix/s - với GPU Xe-core được cho là 12 (hoặc 24?) Nhận được 7.231Mpix/s. Giả sử phép toán về số lượng trình đổ bóng là chính xác, các chip không xác định có thể dễ dàng đánh bại các GPU Alchemist có cấu hình tương tự.

Những GPU "mới" này ngang tầm với A580 và A750, nhưng có ít bộ đổ bóng hơn nhiều, cộng với cấu hình bộ nhớ khác. Nếu đây là Battlemage và có thể đạt xung nhịp cao hơn 40% so với tốc độ 1,8 GHz được hiển thị ở đây, đồng thời nếu chúng tôi nhận được chip có tới 32 lõi Xe và 4096 bộ đổ bóng, thì chúng tôi sẽ đạt được mức hiệu suất khá. Số lõi Xe nhiều gấp ba lần so với GPU 10 lõi được cho là cộng với xung nhịp cao hơn sẽ có khả năng đưa một con chip Intel như vậy vào lãnh thổ RTX 4070 Ti . Nhưng chúng ta đừng quá lo lắng, vì bộ nhớ đệm và các thông số kỹ thuật khác trông vẫn kỳ quặc và số lõi Xe thực sự có thể gấp đôi số lượng chúng tôi đã sử dụng.

Chúng tôi đã học được từ cả AMD và Nvidia rằng bộ đệm lớn hơn trên GPU có thể cải thiện hiệu suất đáng kể. Intel cũng đã học được điều này và mặc dù có lẽ đã quá muộn để bổ sung bộ nhớ đệm lớn cho Alchemist, nhưng chúng tôi chắc chắn mong đợi Battlemage sẽ có bộ nhớ đệm lớn hơn. 8MB không đủ, mặc dù có thể đơn giản là Intel có bộ đệm L3 và SiSoftware không truy vấn hoặc báo cáo giá trị đó.

Cuối cùng, vẫn còn quá sớm để nói Battlemage sẽ nhanh như thế nào, nhưng những rò rỉ thông số kỹ thuật được cho là này ít nhất có vẻ hứa hẹn. Nếu chip 12 Xe-core tốc độ 1,8 GHz có thể sánh ngang với A750 và nếu Intel đạt tới 32 lõi Xe với Battlemage, thì chúng tôi thực sự có thể đang xem xét các giải pháp Intel có tính cạnh tranh hợp lý có thể cạnh tranh với AMD cao cấp và các giải pháp của Nvidia. Có lẽ.

Ngoài ra, đó là chip Battlemage 24 Xe-core chạy ở tốc độ 1,8 GHz và phù hợp với chip Xe-core Alchemist 2,4 GHz. Chúng tôi đã biết A750 nằm ở đâu trong hệ thống phân cấp điểm chuẩn GPU của chúng tôi , nhưng mặc dù việc tăng xung nhịp và hiệu suất lên 50% chắc chắn sẽ hữu ích, nhưng điều đó vẫn chỉ dẫn đến điều gì đó ngang bằng với RTX 3070 và chậm hơn RTX 4060 Ti. Hãy hy vọng điều này không xảy ra.

Intel đã đi sau đối thủ hai năm,và với việc Intel xác nhận rằng quá trình phát triển phần cứng Battlemage đã hoàn tất và 70% thành viên trong nhóm đã chuyển sang Celestial— kiến ​​trúc GPU của nó sau Battlemage — chúng tôi hy vọng những kết quả bị rò rỉ này là dành cho các GPU trong tương lai có ngân sách phù hợp và các biến thể lớn hơn và nhanh hơn đáng kể đang được triển khai. Tạm thời, 30% nhóm đồ họa còn lại của Intel đang làm việc về hỗ trợ phần mềm và trình điều khiển cho Battlemage, để chuẩn bị ra mắt vào cuối năm nay.