Главная · Обзоры  · Планшеты на nvidia tegra 3. Процессоры

Планшеты на nvidia tegra 3. Процессоры

Дженсен Хуан (Jen-Hsun Huang), являющийся генеральным директором известной многим компании NVIDIA, сообщил на конференции AsiaD: All Things Digital о планах дальнейшего развития платформы Tegra. Данная платформа не является видеокартой, производством которых славится компания NVIDIA, а представляет собой чип, который включает в себя все основные компоненты компьютера, такие как графический процессор, контроллеры памяти, ARM-процессор, медиапроцессоры и др. Платформа Tegra специально рассчитана на её использование в мобильных устройствах (смартфоны , планшеты , смартбуки и др.) и характеризуется небольшим размером и низким энергопотреблением. Генеральный директор NVIDIA рассказал, что компания планирует перейти к новому циклу выпуска платформ Tegra. Отныне предполагается, что новая платформа будет выходить раз в год и первой в этом цикле станет платформа NVIDIA Tegra 3 , речь о которой пойдёт в данной статье.
NVIDIA Tegra 3 получила кодовое название Kal-El, которое означает имя такого известного супергероя, как Супермен. В дальнейшем устройства из линейки Tegra должны получить кодовые названия по именам таких героев, как Wayne (Бэтмен), Logan (Росомаха) и Stark (Железный человек). В развитие линейки Tegra будет вложено масса средств, и в настоящий момент размер инвестиций уже достиг двух миллиардов долларов. Следует отметить, что эти вложения не пропали даром и Tegra 3 стала первой платформой на архитектуре ARM, имеющей четырёхъядерный процессор. Планируется, что в будущем в устройствах из линейки Tegra будут использованы ещё многие другие прогрессивные технологии.
Впервые о создании 4-ядерного чипа Tegra компания NVIDIA сообщила в начале этого года. Такая новость заставила других производителей приступить к разработке аналогичных устройств. Однако, NVIDIA намеренно не сообщила о всех тонкостях новой платформы. В результате, ключевым моментом стало не увеличение количества ядер, а использование новой технологии vSMP (Variable Symmetric Multiprocessing). Суть технологии заключается в том, что несмотря на то, что чип Tegra 3 будет работать как четырёхъядерное устройство, он будет оборудован пятью ядрами с архитектурой Cortex-A9. Использование этой технологии позволяет добиться низкого энергопотребления независимо от того, используется ли устройство на всю мощность или для простых задач, не требующих больших частот.


Как же компании NVIDIA удалось добиться подобного эффекта? Дело в том, что существует два техпроцесса: LP и G. LP характеризуется тем, что, работая на низкой тактовой частоте, он является наиболее энергоэффективным, но при увеличении частот расход энергии резко увеличивается. Техпроцесс G имеет противоположные свойства, т. е., работая на высоких частотах, он оказывается намного более энергоэффективным, чем LP. Именно поэтому NVIDIA решила добавить 5-ое ядро (companion сore), которое создано на основе техпроцесса LP и работает отдельно от остальных ядер. Данное ядро-спутник имеет тактовую частоту до 500 МГц и обеспечивает низкое потребление энергии. Остальные 4 ядра созданы на основе техпроцесса G и рассчитаны для решения более сложных задач с минимальным потреблением энергии.

Схема работы этой технологии выглядит следующим образом: пока устройство используется для решения простых задач и ему не нужны большие вычислительные мощности, активным является только одно пятое ядро, но как только появляется потребность в высокой производительности, пятое ядро становится неактивным, а в работу включаются 4 основных ядра. Не трудно догадаться, что подобный подход обеспечивает энергоэффективную работу устройства как при минимальных нагрузках, так и в случае работы на полную мощность. Следует отметить, что 4 основных ядра тоже не активируются все сразу, а только по мере необходимости. Переключение с одного ядра на четырёхъядерный режим происходит незаметно для пользователя и занимает около 2 мс. Технология vSMP так же облегчает работу разработчиков программного обеспечения, поскольку обеспечивает использование программами новой архитектуры незаметно для самих программ.


В результате чипы NVIDIA Tegra 3 способны потреблять меньше энергии, чем такие конкуренты, как Qualcomm QC8660 и TI OMAP4, и при этом обеспечивать вдвое большую производительность. Чип Tegra 3 Kal-El (CPU и GPU) работает примерно в 5 раз быстрее предыдущей версии Tegra 2 , обеспечивая при этом лучшую энергоэффективность вне зависимости от режима работы. Среди других технических характеристик Tegra 3 следует отметить тактовую частоту основного процессора в 1,5 ГГц, наличие 12-ядерного графического процессора и видеовыхода с максимальным разрешением 2560×1600.

Первым устройством, оборудованным чипом NVIDIA Tegra 3, стал планшет ZTE T98, оснащённый одним гигабайтом оперативной памяти, двумя цифровыми камерами и 16-ю гигабайтами внутренней памяти. Устройство имеет сенсорный экран с разрешением 1280×800 пикселей и толщину в 11,5 мм. В качестве программной платформы на ZTE T98 установлена мобильная ОС Android 3.2 (Honeycomb).

Компания NVIDIA официально представила новое поколение своих мобильных процессоров. NVIDIA Tegra 3 - это многоядерный 1,4 ГГц ARM Cortex-A9 процессор с 4 основными высокопроизводительными процессорными ядрами, 1 дополнительным ядром небольшой мощности, так называемым "компаньоном", и 12 графическими ядрами.

Новые чипы NVIDIA предназначены для смартфонов, планшетов и других мобильных устройств. Первым устройством с процессором Tegra 3 является планшет Asus Eee Pad Transformer Prime, который появится в продаже в декабре этого года.

Следующие устройства с четырехъядерным процессором, по заявлению NVIDIA появятся в начале 2012 года.

До недавнего времени процессор NVIDIA Tegra 3 носил кодовое наименование Kal-El, но теперь компания называет свой новый мобильный процессор просто как Tegra 3.


Четыре основных и дополнительное ядро "компаньон"

По сведениям NVIDIA, процессор обеспечивает в 5 раз большую производительность, чем его предшественник, чип NVIDIA Tegra 2, на основе которого создано большинство Android планшетов, выпущенных в этом году. Он также имеет в 3 раза лучшую графическую производительность с поддержкой сложных эффектов, таких как динамическое освещение и тени.

Несмотря на то, что новый чип является одним из самых мощных ARM-процессоров на сегодняшний момент, он потребляет меньше энергии, чем предыдущие чипы NVIDIATegra 2. Например, Eee Pad Transformer Prime имеет время автономной работы около 12 часов и это без использования дополнительной батареи, расположенной в его док-станции.

Таких поразительных результатов, компании удалось добиться благодаря расширенным возможностям управления работой всех ядер процессора. Максимальное потребление энергии происходит в момент, когда все ядра работают на максимальную мощность. Если в старых процессорах управление энергопотребления осуществлялось за счет уменьшения или увеличения рабочей частоты процессора, то новый чип NVIDIA умеет в зависимости от нагрузки еще и отключать «лишние» ядра.


При проигрывании видео, музыки и в спящем режиме работает только дополнительное ядро

Четыре основных процессорных ядра в новом чипе могут работать на частоте до 1,4 ГГц, и как и раньше, эту частоту можно менять. Пятое ядро само по себе может выступать в роли полноценного процессора. Он имеет максимальную тактовую частоту всего 500 МГц, но этого достаточно, чтобы с помощью этого ядра можно было проигрывать HD видео 1080p, слушать музыку или выполнять другие более простые задачи.

Например, во время серфинга в Интернете, основные процессорные ядра помогут ускорить загрузку веб-страницы, но они могут быть отключены, когда вы просто читаете текст и всю нагрузку по прокрутке изображения на странице, возьмет на себя менее мощный «компаньон».


При загрузке простых веб-страниц работает одно основное ядро

Как говорит компания NVIDIA, эта технология управления ядрами разработана таким образом, что она будет работать с широким спектром приложений, независимо от того, были они разработаны специально для использования с многоядерным процессором Tegra 3 или нет.

Однако, приложения, которые были разработаны с учетом возможностей Tegra 3, смогут предложить пользователю более продвинутые графические возможности. Чтобы показать эти возможности, NVIDIA ссылается на демо-версии нескольких игр, которые были разработаны специально для Tegra 2 и Tegra 3 устройств. В то время как Tegra 2 игры, как для мобильных игр, выглядят великолепно, но Tegra 3 версии поддерживают еще более богатые текстуры и обеспечивают более реалистическую физику, не говоря уже о быстродействии.

Например, игра гонки на воде Riptide отлично работает на устройствах с обоими процессорами, но в Tegra 3 версии добавлена поддержка эффекта размытия в движении и брызги воды стали еще более реалистичными – в каждой капле можно увидеть отражение окружающей картины.

В настоящее время, уже более 15 игр с поддержкой четырехъядерного процессора NVIDIA Tegra 3, находятся в стадии разработки, и в дальнейшем их число будет только расти.

Если говорить об игровых возможностях, то в новую платформу добавлена поддержка распространенных игровых контроллеров. NVIDIA предоставит программное обеспечение своим партнерам, и в будущем вы сможете свободно использовать Playstation 3, Xbox 360, Nintendo Wii в паре со своим планшетом или смартфоном.

Кроме того, что новый чипсет имеет поддержку стереоскопической 3D графики, он также может конвертировать 2D игры или видео в 3D в режиме реального времени и выводить полученное видео на 3D-телевизор или монитор через порт HDMI 1.4.

Ускорение графики, владельцы планшетов и смартфонов с новым чипом на борту, заметят не только в играх. NVIDIA Tegra 3 также предлагает аппаратное ускорение для Adobe Flash, HTML5, WebGL и других веб-технологий, что приведет к ускорению загрузки страниц и улучшенной поддержке мультимедийных материалов в Интернете.


Обработка Javascript и Flash: Tegra3 до 4 раз быстрее конкурентов

Повышение производительности позволит планшетам и телефонам работать с приложениями и задачами, для которых традиционно использовались настольные компьютеры.

С новым, быстродействующим процессором, вы сможете на мобильном устройстве выполнять такие ресурсоемкие задачи, как перекодирование видео или редактирование фото. Как заявляет NVIDIA, процессор Tegra 3 в этих задачах показывает результат в два раза лучший, чем могут предложить остальные мобильные чипы.


Обработка видео: Tegra3 в 2 раза быстрее остальных мобильных процессоров

Хотя Tegra 3, скорее всего, будет использоваться в основном в Android телефонах и планшетах, в конечном итоге мы вполне можем увидеть этот процессор и в Windows планшетах и ноутбуках. Microsoft Windows 8 будет первой операционной системой из семейства Windows с полной поддержкой ARM-процессоров, и здесь NVIDIA сможет конкурировать не только с Qualcomm, Texas Instruments и Samsung, а также с такими гигантами как Intel и AMD.

Похожие материалы:

Ouya использующую ОС Android с уровнем графики «не хуже» чем в играх для Xbox 360 и PS 3. Сердцем данной консоли будет система на чипе NVIDIA Tegra 3. Зарубежный игровой портал Eurogamer решил провести тестирование планшетов, оснащенных этой системой с целью выяснить, насколько она производительна для игр.

Компания NVIDIA с фирменной мобильной линейкой Tegra постепенно завоевывает мир мобильных устройств. Последняя версия знаменитого чипа компании - Tegra 3, установлена в огромном количестве устройств как высокого, так и среднего ценового диапазона. Насколько близко микроскопическая Tegra подобралась к обычному консольному железу? Сможет ли 200 долларовый планшет Nexus 7 быть игровой платформой и чего мы можем ожидать от Ouya , выход которой состоится в марте 2013 года?

Давайте попробуем ответить на эти вопросы. В тестировании производительности приняли участие следующие продукты:

  • Google Nexus 7 (nVidia Tegra 3 4+1 ядер @1.4 ГГц, 1 Гб ОЗУ, 7" экран с разрешением 1280 x 800 WXGA 16:10);
  • ASUS Transformer Pad TF300 (nVidia Tegra 3 4+1 ядер @1.2 ГГц, 1 Гб ОЗУ, 10" экран с разрешением 1280 x 800);
  • ASUS Transformer Prime (nVidia Tegra 3 4+1 ядер @1.4 ГГц, 1 Гб ОЗУ, 10" экран с разрешением 1280 x 800).
Начнем мы с тестирования «Тегры» как платформы для мобильных игр

В данном случае авторами было решено использовались такие игры как Sonic 4 Episode 2 и Shadowgun . Компания NVIDIA выпустила специальные версии этих игр в своем магазине TegraZone. Сделано это было потому что новая Tegra 3 предлагает больше вычислительной мощности, задействовать которую можно немного изменив игровой движок.

Оптимизированная для платформы Tegra 3 игра Sonic 4 демонстрирует богатство графических нововведений по сравнению с обычным Android и IOS девайсами. Сразу заметно увеличение числа полигонов, более четкие декорации, тени от воды и дополнительное освещение. Впечатляет то, как много консольных графических опций можно увидеть в планшетах среднего уровня.


В ходе тестирования, Nexus 7 и TF300 показали отличные результаты, FPS был выше 30 кадров в секунду, а если провалы в производительности и были, то заметить их человек не сможет. Включение максимальных настроек не снижает производительность, просадки FPS можно заметить только у больших 10” планшетов, на 7” Nexus 7 их практически не бывает.




Шутер от третьего лица Shadowgun прекрасно доказывает то, что «большие» игры могут работать и работают на сенсорных устройствах. Этот же подход мы видим в графике. Общее впечатление от игры отражает тот факт, что исходная версия для Xbox 360 подверглась значительным нововведениям. Были добавлены такие эффекты как зеркальное и диффузное отражение с освещенных поверхностей, динамическое и дополнительное освещение, физика таких предметов декора как флаги, одежда, вода, и другие.

Конечно, в шутер лучше играть на компьютере или консоли - сенсорное управление недостаточно интерактивное, да и в наиболее сложных сценах упавшее количество кадров в секунду негативно отразиться на игровом процессе.
игровой процесс.

Если говорить в целом, то среди представленных устройств лучшей производительностью обладает Transformer Prime: он лучше справляется со сложными сценами, а в случае просадок производительности быстрее поднимает ее до комфортного уровня. По сравнению с конкурентами разница не большая, но с учетом большого дисплея планшет выглядит достаточно здорово.

Помимо игр специально адаптированных для Tegra 3, существуют и другие, работающие на любых устройствах под Android и на iOS. Поэтому на втором этапе были протестированы такие игры как NOVA 3 , Riptide GP , Dead Trigger и Grand Theft Auto 3. Что важно, все они позволяют покрутить настройки графики до нужного уровня.

Поскольку разработчики не знают, на каком железе будет работать их игра, зачастую все игры на Android работают без фиксации FPS, причем число кадров в секунду может резко изменяться в любой момент. На консолях FPS строго ограничен и падений производительности нет, ввиду строго определенного набора аппаратных средств. В это же время, на PC игроки требуют выпускать игры вообще без ограничений на число кадров в секунду.

GTA3 на максимальных настройках вызывает определенных проблемы с FPS на планшете Nexus 7, однако не большое их снижение позволяет поднять частоту кадров до комфортных 30 FPS, получить плавный игровой процесс и более отзывчивое управление.


В свою очередь, NOVA 3 (мобильный клон Crysis 2) непосильная ноша для планшета Nexus 7. FPS редко повышается до 20, а зачастую болтается в районе 15. NVIDIA плотно сотрудничает с Gameloft, чтобы лучше оптимизировать игру для аппаратов на базе «Тегры», но пока никаких реальных подвижек владельцы смартфонов и планшетов не видят. На том же «новом IPad» NOVA 3 работает нормально и показывает большие значения FPS.


Что касается зомби-шутера Dead Trigger , то он демонстрирует «живую» воду и прекрасную физику исключительно на Tegra 3. Мы можем также увидеть дым, туман, лучшую систему освещения, мягкие тени и другое. Игровые персонажи также выглядят на отлично. Игра выдает больше 30 FPS на всех планшетах Tegra, иногда поднимая производительность до 60 FPS. Единственная возможная проблема, с которой можно столкнуться от долгого сидения за игрой - неприятный нагрев планшета.


Riptide GP также прекрасно показывает себя на новой платформе. Графика в игре поддерживает реалистичную прорисовку воды и расчет физики, а что особенно впечатляет, так это то, что действия игрока адекватно влияют на модель обработки окружающего мира. NVIDIA Tegra 3 отлично обрабатывает и другие эффекты, вроде брызг воды, зеркального отражения, а FPS редко падает ниже 60.


На Transformer Pad TF300 и Nexus 7 изредка, в тяжелых сценах, можно увидеть просадки до 40 кадров в секунду, что для такой динамичной игры не желательно. Transformer Prime, тактовая частота процессора которого несколько выше, лучше справляется с данной нагрузкой, особенно при максимальном разрешении и сглаживании.

Заключение
В конечном счете, Tegra 3 показала себя в качестве мобильной игровой платформы достаточно хорошо. Единственный вопрос, который остается открытым и ответ на который мы узнать не сможем: «Насколько Tegra 3 хороша для игр 2013 года?» . Как вы понимаете, в мире высоких технологий все меняется очень стремительно и в следующем году нас ждут еще более производительные чипы.

Чтобы замедлить технологическую гонку, NVIDIA плотно сотрудничает с крупнейшими производителями мобильных игр. Как мы знаем по PC-сегменту, ей это всегда удается отлично. Усовершенствования, которые появятся в результате такого симбиоза предоставят покупателям отличную графику при хорошей производительности.

Что до применения Tegra 3 в консоли Ouya , то нельзя не отметить, что уже сейчас разработчики подобрались к уровню графики первого Xbox, по крайней мере, у нас сложилось такое впечатление. Но производительности пока не хватает, чтобы выводить на огромный телевизор картинку, эквивалентную качеству графики в PlayStation 3 или Xbox 360.

Учитывая особенности архитектуры Ouya , возможно ожидать, что с выводом хорошей картинки на экран телевизора она справится. Разработчики планируют достигнуть этого, за счет установки более производительного чипа Tegra T33, у которого больше тактовая частота CPU и GPU. Теоретически 2 ГГц Tegra 3 T33, в содружестве с 620MHz ядром GeForce, увеличит производительность Ouya на 30%, по сравнению с Nexus 7.

Даже если процессор Ouya превзойдет наши ожидания, мы не можем забывать о конкурирующих системах. Речь конечно же идет о новом PowerVR в продуктах Apple шестого поколения и четырехядерном Qualcomm Snapdragon S4, с архитектурой следующего поколения ARM Cortex A15 и графической подсистемой Adreno 320 GPU. Эти продукты будут в паритет с Tegra 3 и даже смогут ее превзойти.

И это вызывает самое большое беспокойство. К моменту выхода консоли Ouya , а это март 2013 года, консоль окажется со стандартным железом, а не с супермощным процессором. NVIDIA во втором квартале следующего года планирует выпустить в продажу систему на чипе Tegra 4 (с кодовым именем Wayne). Про Apple и Qualcomm мы уже сказали.

Может оказаться, что Ouya устареет в течении 2013 года. А для пяти с половиной миллионов человек, оформивших на Kickstarter предзаказ это будет крайне не приятно. Ведь скорее всего на смену Ouya появится «Ouya 2» или нечто подобное.

С другой стороны, консоль могут полюбить инди-разработчики, которые не гонятся за графикой, предпочитая вкладывать в проект душу. Компания NVIDIA уже может предложить большой каталог программ, заточенных под различные чипы Tegra и к следующему году их будет еще больше. Доступность, низкая цена, большой выбор игр - за это консоль Ouya могут полюбить покупатели, что положительно скажется на всех участниках рынка.

Разработчики нашумевшей игровой консоли OUYA решили отложить выпуск приставки с 4 на 25 июня, о чём сообщил в своём пресс-релизе.

Исполнительный директор OUYA Джули Урман пояснила это решение высокими ожиданиями спроса, и боязнью того, что компания не сможет его удовлетворить. «Мы получили невероятно позитивные реакции от наших розничных партнёров» , — заявила директор. Сдвиг сроков «позволит нам изготовить больше приставок и, в основном, получить больше приставок на полках магазинов» .

Также компания сообщила, что имеет некоторые проблемы с существующими кнопками на контроллере. Поэтому разработчики решили расширить отверстия кнопок, чтобы розничные покупатели не столкнулись с той же проблемой, что и обладатели приставки, получившие её по правилам Kickstarter. Дело в том, что владельцы жаловались на заедание кнопок игрового контроллера. И хотя эта проблема кажется очень опасной, Урман заверила, что это никак не повлияет на продажи: «Мы сделали эти изменения очень давно, так что все приставки были изготовлены с изменёнными увеличенными отверстиями под кнопки» .

Консоль OUYA показала плохие результаты в 3DMark

23 апреля 2013 года

Игровая консоль OUYA на базе операционной системы Android во время своего стартапа буквально перевернула рынок, а все аналитики наперебой предсказывали приставке большое будущее.

Однако на практике результаты оказались не слишком хороши. По крайней мере таковыми, для приставки основанной на SoC Tegra 3, они являются, в популярном бенчмарке 3DMark.

Согласно базе результатов Futuremark, производительность OUYA нельзя назвать чем-то выдающимся на фоне нынешних планшетных ПК и смартфонов.

Средний результат тестирования составил 4077 баллов в обычном режиме и 2381 балла в пресете extreme. В результате среди 257 устройств с операционной системой Android консоль заняла 73 место. Конечно, по результатам одного бенчмарка ещё рано хоронить даже не родившуюся консоль, однако теперь мнение критиков наверняка поменяется на диаметрально противоположное, и на приставку обрушатся волны негатива.

Приставка OUYA должна поступить в розничную продажу 4-го июня, однако разработчики и первые заказчики игровой системы уже получили её и проводят на ней некоторые эксперименты.

Производители видеокарт выходят на рынок планшетов

26 февраля 2013 года

Аналитики отмечают весьма заметный спад спроса на графические решения у всех четырёх производителей GPU . И главной причиной тому считают популярность планшетных ПК.

Обратив внимание на этот тренд, китайский производитель материнских плат Onda и производитель видеокарт Colorful решили выйти на рынок планшетов начального уровня. Также производитель видеокарт Galaxy Microsystems, скооперировавшись с NVIDIA, начал выпускать планшетный ПК ценой в 149 долларов.

Новый планшет Galaxy — Galapad, имеет IPS дисплей диагональю 7” и четырёхъядерный процессор NVIDIA Tegra 3.

Компания Onda уже имеет опыт выпуска планшетов начального уровня, однако столкнулась с конкуренцией со стороны прочих Китайских производителями планшетов, в результате лишь совсем недавно фирма начала активно продавать свои продукты.

Colorful будет продавать свои планшеты под брендом Colorfly, и запустит модели с экранами диагональю 7, 8, 9,7, 10,1 и 13 дюймов. Производством планшетов для компании занимается тайваньская фирма Chaintech Technology, а продаваться они вначале будут в Китае и Юго-Восточной Азии.

Графика Qualcomm быстрее, чем у NVIDIA

12 февраля 2013 года

Сейчас компания NVIDIA занимает в плане производительности графики лидирующее место на мобильном рынке. И никто даже не мог и подумать о том, что чипы Tegra можно обойти. Однако Qualcomm решила бросить вызов именитому производителю видеокарт.

Директор по маркетингу Qualcomm Ананд Чандразехер сообщил Forbes, что чипы Snapdragon быстрее, чем Tegra и при этом проще. Он заявил, что S4 быстрее Tegra 3, однако, что более важно, будущие процессоры Qualcomm будут быстрее, чем Tegra 4.

«Недавно NVIDIA выпустила свою Tegra 4, не знаю, когда она появится на рынке на коммерческой основе, но мы считаем, что наша Snapdragon 600 обойдёт по производительности Tegra 4 от NVIDIA. И мы считаем, что Snapdragon 800 окончательно побьёт её и установит новый рекорд в бенчмарках. Так что мы подчистим Tegra 4. В Tegra 4 нет ни одной вещи, на которую бы мы посмотрели и которая бы нас заинтересовала. Откровенно говоря, Tegra 4 выглядит как то, что мы уже имеем в S4 Pro» , — заявил Чандразехер.

Он также пояснил, что опыт NVIDIA, который она имела в производстве видеокарт, некоторое время помогал зелёной фирме одерживать верх над конкурентами, но всё меняется. «Опытным путём мы полностью победили их по производительности графики» , — добавил директор.

Fujitsu выпускает влагозащищённый планшет

8 февраля 2013 года

Компания Fujitsu решила выпустить собственный планшетный ПК с процессором Tegra 3. Гаджет получил название Arrows Tab Wi-Fi FAR70B и вряд ли выделялся бы чем-то особенным от прочих высокопроизводительных планшетов, если бы не его влагозащищённость.

Планшет FAR70B имеет на борту операционную систему Android 4.0 ICS. Экран планшета диагональю 10,1” получил разрешение 1920х1200. Система-на-чипе NVIDA Tegra 3 работает с частотой 1,7 ГГц. Также платформа оснащена 2 ГБ ОЗУ, 32 ГБ встроенной памяти, слотом для карт памяти microSD, двумя камерами (1,3 Мпикс на передней панели и 8,1 Мпикс на задней), модулями GPS, Wi-Fi , Bluetooth 4.0, звуковой системой Dolby Digital Plus и пылевлагозащитным корпусом. Для энергопитания гаджета в нём установлен аккумулятор ёмкостью 1080 мА·ч.

Примечательно, что планшет от Fujitsu является одним из первых устройств со звуковой системой Dolby Digital Plus. На нём будет крайне удобно смотреть видео высокой чёткости с многоканальным звуком, поскольку благодаря звуковой системе нового поколения два корпусных динамика устройства позволят владельцам гаджета наслаждаться трёхмерным окружающим звуком.

Планшет Arrows Tab Wi-Fi FAR70B поступит в продажу в конце следующей недели. Цена, к сожалению, не называется.

NVIDIA запускает Tegra Zone

4 января 2013 года

Перед самым Новым годом компания NVIDIA объявила о планах по запуску Android приложения под названием Tegra Zone, предназначенного специально для пользователей мобильных устройств с процессором Tegra.

Это приложение предназначено для того, чтобы пользователи могли найти программу, специально оптимизированную для чипа в их планшете или смартфоне. Учитывая, что сейчас огромная масса производительных мобильных систем основана на Tegra 3, должно появиться достаточно большое количество оптимизированных приложений.

Поскольку приложение Tegra Zone было, по сути, лишь официально объявлено, а фактически работает уже продолжительное время, счётчик его загрузок превысил 5 миллионов. Надо отметить, что подобное приложение — Game Command, выпустила и Qualcomm, однако успеха это средство не имеет. В настоящий момент Tegra Zone имеет в списке 67 игр, которые специально оптимизированы для достижения наилучшей производительности с процессорами NVIDIA.

Если же в Санта-Кларе решат выпустить подобное приложение и для Windows RT, то в него сразу можно будет включить 15 приложений, из которых 10 уже сейчас доступны для приобретения. Конечно же, производительные устройства с Windows RT на борту в основном будут основаны на Tegra 3, и NVIDIA не упустит шанса занять игровой рынок и в этой среде. Но, для сравнения, отметим, что сейчас для Windows RT зарегистрировано 2433 игры, так что доля оптимизированных для NVIDIA в этом числе предельно мала.

SoC Intel производительнее Tegra 3

27 декабря 2012 года

Если это не чья-то шутка, то новость просто ошеломляет. Двухъядерный процессор Atom Clover Trail в некоторых задачах потребляет вдвое меньше энергии, чем Tegra 3.

Такое заявление недавно сделала группа аналитиков, сообщает Fudzilla. Она утверждает, что графический блок Imagination Technologies в Clover Trail потребляет меньше энергии, чем графика от NVIDIA.

Натан Буквуд, глава рыночного обозревателя Insight64 заявил, что производительность планшетов на базе Clover Trail, если не лучше, чем у ARM SoC , то, по крайней мере, потребляет меньше энергии, что удивительно. Натан так же как и мы был удивлён этим фактом.

Таким образом, два урезанных ядра Intel оказались быстрее, чем четыре основных и одно вспомогательное ядро NVIDIA. Конечно, эти утверждения ничего не говорят о том, как оба чипа поддерживают Android. Однако Windows RT не использует вспомогательное ядро также интенсивно, как Android.

Но во второй половине 2013 года ситуация может снова измениться, поскольку Intel планирует выпустить Bay Trail, в котором должны использоваться новые ядра Atom, значительно повлияющие на производительность. Со своей стороны продукты на базе Tegra 4 уже будут находиться в продаже. Так что война только начинается.

Игровой планшет Wikipad выйдет 31 октября

17 сентября 2012 года

Люди, которые любят играть на своих планшетах, но не имеют для этого аналоговых джойстиков, наконец-то будут удовлетворены.

Компания GameStop анонсировала свои планы по выпуску Wikipad, планшета, который поставляется с «присоединяемым игровым контроллером консольного качества» .

Компания Wikipad начнёт продавать свой игровой планшет с мероприятия GameStop, которое состоится 31 октября. При этом разработчик просит за гаджет 500 долларов США.

Сам планшет будет оснащён экраном с IPS матрицей диагональю 10,1”, процессором NVIDIA Tegra 3, дополнительным слотом для карт памяти и доступом к играм платформы Sony PlayStation Mobile, равно как и к играм, вещаемым в сервисе Gaikai. Присоединяемый игровой контроллер будет содержать два аналоговых джойстика, D-pad, четыре кнопки управления и боковые кнопки и переключатели, предназначенные для симуляции консольных игр.

Те, кто не может дождаться выхода планшета уже может сделать предварительный заказ на сайте www.GameStop.com . Как обычно, люди, сделавшие покупку заранее, получат некоторые преимущества. Ими станут несколько полноценных версий игр и подписка на Game Informer Digital

первый взгляд на новую систему на чипе

Введение

В предыдущей статье мы подробно рассмотрели популярную у производителей мобильных устройств систему на чипе NVIDIA Tegra 2 . А сегодня у нас на повестке дня - довольно подробная, но предварительная информация о следующем решении компании, под кодовым названием Project Kal-El. В прошлой статье мы упоминали об этом решении, но недавно NVIDIA раскрыла некоторые подробности об устройстве чипа. Для начала давайте рассмотрим планы компании по выпуску SoC в целом.

Недавно ставшие известными планы NVIDIA по выпуску систем на чипе на ближайший период до конца 2012 года открыли кодовые имена нескольких новых решений. Помимо Kal-El в планах компании присутствует улучшенная версия Kal-El+ (вероятнее всего, это ускоренный Kal-El, возможно, изготовленный уже при помощи техпроцесса 28 нм), Wayne (последователь Kal-El, следующее поколение), а также система на чипе Grey, предназначенная для менее мощных систем.

Появление Kal-El+ в планах компании вполне ожидаемо и никого не удивило. Ведь это довольно простое и логичное решение - увеличить тактовую частоту чипа, а может сразу и перевести производимый по техпроцессу 40 нм чип на технологию 28 нм, получив преимущество в энергоэффективности и возможности работы на большей частоте. Тем более что после выхода версии Tegra 2 с частотой 1,2 ГГц стало понятно, что NVIDIA планирует выпуск новых SoC каждые полгода.

Ускоренная Tegra 2 для топовых мобильных устройств станет менее привлекательной, ведь теперь вместо Tegra 2 с 1.2 ГГц частотой можно сразу начать выпуск планшетов, использующих гораздо более мощную систему Kal-El. С другой стороны, выход Kal-El уже был отодвинут на несколько месяцев: NVIDIA ожидала появления первых планшетов с Kal-El в августе, но на деле они выйдут не раньше последнего квартала. И вполне возможно, что и вариант Tegra 2 на 1,2 ГГц успеет получить распространение в конечных продуктах. Да и для планшетов и смартфонов среднего ценового диапазона этот SoC вполне могут продолжать выпускать.

Что касается будущих решений, то Kal-El+ выглядит естественным апгрейдом «обычного» Kal-El. А потенциально возможное применение техпроцесса 28 нм позволит поднять частоты этого SoC от 1+ ГГц до 2+ ГГц, дав возможность конкурировать с аналогичными SoC компаний Qualcomm, Texas Instruments, Samsung и др. К слову, судя по словам главы компании, сама NVIDIA считает своим основным конкурентом именно Qualcomm.

Wayne появится лишь в 2013 году, и это, по всей вероятности, будет система на чипе, использующая вычислительные ядра Cortex A15, а также совершенно новое графическое ядро, в отличие от трёх предыдущих поколений Tegra, использующих одну и ту же графическую архитектуру. Похоже, что именно Wayne сможет сделать следующий значительный скачок в производительности, так как ядра Cortex A15 даже при прочих равных быстрее на 40-100%, чем Cortex A9 (по оценкам компании ARM). Поэтому SoC на Cortex A15, работающий на частотах порядка 2-2,5 ГГц, будет в разы быстрее пока ещё не вышедшего Kal-El.

Судя по утекшей странице из презентации NVIDIA, система на чипе Grey будет предназначена исключительно для смартфонов, а не для планшетов, что может говорить о том, что это - менее мощное решение, нацеленное на средний ценовой диапазон. Так что Grey будет менее производительной системой, но и значительно менее дорогой. Также важно, что Grey уже будет включать в себя и радиочасть - в виде наработок компании Icera, поглощённой NVIDIA. Более мощные решения, такие как Wayne, продолжат использовать отдельный чип модема, а Grey станет чипом с более высокой степенью интеграции, что особенно важно для недорогих смартфонов.

Предоставление системы на чипе вместе с 2G/3G/LTE модемом позволит сократить время выхода конечных продуктов на рынок. Кроме того, отличительными особенностями именно модемов Icera являются малый размер и энергопотребление, а также возможность внедрения поддержки новых стандартов связи на программном уровне, обновлением прошивки. Российским пользователям будет интересно узнать, что модемы Icera используются в распространённых мобильных модемах и беспроводных устройствах, таких как модемы, выпускаемые под брендами компаний-операторов МТС и Beeline.

После вышеперечисленных SoC от NVIDIA можно ожидать по-настоящему интересного решения - собственной разработки под кодовым именем Project Denver. Важнейшим изменением в Project Denver будет то, что NVIDIA планирует использовать вычислительные ARM-ядра своего дизайна, а не модифицированные изделия компании ARM. Этот чип будет иметь уже значительно большее количество вычислительных ядер, и нацелен на применение в серверах, высокопроизводительных настольных и мобильных системах. Конечно, такой чип уже не будет иметь столь низкое потребление энергии, как Tegra 2 и Kal-El, да и сам чип явно станет больше. Но всё же его потребление должно остаться меньшим, по сравнению со схожими по производительности x86-процессорами.

Внимание компании к мощным мобильным системам понятно, ведь Intel и AMD постепенно вытесняют NVIDIA с рынка ноутбуков и настольных ПК, выпуская всё более мощные интегрированные решения с архитектурой x86, которые становятся вполне достаточными для всё большего количества пользователей. Поэтому NVIDIA не остаётся ничего делать, как пытаться входить на рынок с другой стороны, планируя выпуск мощных систем на базе архитектуры ARM. И это правильный шаг, ведь почти все современные портативные устройства используют именно эту архитектуру, которая вполне может перейти и в более мощные системы.

И сегодня мы поговорим о ближайшей системе на чипе от компании NVIDIA - Kal-El. Первые планшеты и нетбуки, основанные на этой SoC, должны выйти через несколько месяцев, поэтому очень интересно разобраться, какие они будут иметь преимущества и что́ дадут пользователям, по сравнению с нынешними мобильными устройствами.

Основные нововведения в Kal-El

Мы уже много писали о том, что многоядерные CPU (да и системы на чипе) последовательно пробивали себе дорогу на рынке. Сначала многоядерные процессоры применялись в серверных системах, потом перешли и в настольные и мобильные. Основной плюс многоядерных систем, по сравнению с одноядерными той же производительности, заключается в большей энергоэффективности первых. Многоядерникам достаточно работать на меньшей частоте, потребляя меньше энергии, и при этом - в хорошо распараллеленных задачах они ещё и имеют лучшую производительность.

Довольно успешная на рынке система на чипе Tegra 2 уже имеет два вычислительных ядра, и совершенно неудивительно, что тенденция продолжается и в проекте Kal-El. Скорее всего, рост количества ядер уже не остановить, и почти каждое поколение будет приносить большее их количество. NVIDIA анонсировала проект Kal-El ещё в феврале этого года, и эта система на чипе стала первой продемонстрированной в работе мобильной системой, использующей четыре ядра. С тех пор раскрыли свои планы на четырёхъядерники и конкуренты NVIDIA, такие как Qualcomm и Texas Instruments.

NVIDIA выдавала информацию о Kal-El небольшими порциями. В начале года мы узнали, что эта система на чипе будет использовать четыре вычислительных ядра Cortex A9 с 1 МБ общей кэш-памяти второго уровня. А про графическое ядро Kal-El стало лишь известно, что оно будет состоять из 12 «ядер» (как они названы в маркетинговых материалах NVIDIA), по сравнению с восемью «ядрами» Tegra 2. И что это, вместе с архитектурными улучшениями и возросшей частотой, должно дать прирост производительности до 2-3 раз. Кстати, о тактовых частотах Kal-El пока известно лишь то, что цель NVIDIA - превзойти частоту Tegra 2. Но вряд ли получится превзойти её намного, так что будем ожидать частот порядка 1,2-1,3 ГГц.

Но мы пока говорим не о конкретных параметрах конечного решения, а о его архитектуре. Можно было бы подумать, что в Kal-El будет четыре процессорных ядра, как и ожидалось, но NVIDIA решила сделать необычный ход, представив в Kal-El новую технологию, получившую название Variable Symmetric Multiprocessing (vSMP). Конечно, это скорее маркетинговое название, но не без интереснейшего технического решения. В случае Kal-El технология vSMP подразумевает включение в состав системы на чипе вспомогательного пятого CPU-ядра («Companion»), отличающегося низким потреблением энергии и предназначенного для фоновых и нетребовательных к производительности задач.

Четыре основных ядра работают на значительно большей частоте и включаются в работу в случае запуска задач, требующих большой вычислительной мощи. Все пять процессорных ядер - абсолютно одинаковые ARM Cortex A9, с поддержкой набора инструкций NEON, и все они могут динамически отключаться в зависимости от загрузки процессора работой.

Архитектура Kal-El оптимизирована именно для наиболее распространённых сценариев использования мобильных устройств - бо́льшую часть времени (порядка 80%) они проводят в режиме пониженного энергопотребления (standby) с отключенным экраном и приложениями, запущенными в фоновом режиме. И лишь оставшиеся 20% времени, а то и меньше, на мобильных устройствах запущены требовательные приложения. В режиме standby процессор обычно обрабатывает фоновые задачи, не требующие высокой производительности и взаимодействия с пользователем, зато при активной работе в веб-браузере, мультимедийных приложениях и играх, при проверке электронной почты и пр. устройство должно быть в режиме высокой производительности, требующей функционирования нескольких ядер CPU на максимальных частотах.

Но ведь и в фоновом режиме на современных коммуникаторах и планшетах зачастую работает множество приложений - проверяется почта, работают виджеты, происходит синхронизация данных социальных сетей и т. п. Для этих задач вполне достаточно и ресурсов лишь одного ядра CPU, да ещё и работающего на низкой частоте. Просто потому, что скорость при обработке фоновых задач не так важна, как при взаимодействии с пользователем. А работа вычислительных ядер на низких частотах в режиме standby позволяет увеличить время работы устройства от батареи.

Итак, в системе на чипе Kal-El впервые применили «переменную симметричную мультипроцессорность» (vSMP - Variable Symmetric Multiprocessing). Эта технология помогает уменьшить потребление энергии в режиме простоя и низкой вычислительной нагрузки, но при этом одновременно обеспечивает и мощь четырёх ядер Cortex A9. Вспомогательное ядро Cortex A9 специально оптимизировано для минимизации потребления в простое и в режимах с фоновыми приложениями. Технология vSMP распределяет задачи между основными ядрами и вспомогательным ядром системы на чипе Kal-El.

Для чего NVIDIA вообще понадобилось «городить огород» с пятым колесом ядром? Не проще ли было просто отключать три из четырёх основных ядер, вместе с этим снижая частоту и напряжение? Ответ на этот вопрос довольно прост, но его понимание требует определённых знаний о современных полупроводниковых технологических процессах, о которых мы сейчас вкратце и побеседуем.

Потребление энергии любым чипом зависит от технологического процесса полупроводникового производства, который применялся при его создании; для его определения складываются токи утечек и динамическое потребление энергии. Токи утечек определяются в основном применённым техпроцессом, а динамическое потребление - техпроцессом, а также напряжением питания и частотой чипа. Динамическое потребление полупроводникового устройства пропорционально его тактовой частоте и квадрату напряжения, на котором он работает. При работе чипа на частотах, близких к пиковым, общее потребление в основном зависит от динамического, а токи утечек сказываются не слишком сильно. А вот в режиме простоя или небольшой нагрузки, наоборот, значительный вклад в общее потребление вносят утечки.

Современные производства предлагают несколько вариантов технологических процессов. При использовании «быстрых» техпроцессов транзисторы имеют высокие токи утечек, но при этом имеют быстрое время переключения при нормальном напряжении. То есть они способны работать на более высокой частоте при сравнительно низком напряжении. Транзисторы же техпроцессов низкого потребления (low power) имеют малые токи утечек, но время переключения при нормальном напряжении у них выше, и для работы на более высокой тактовой частоте они потребуют значительного поднятия их напряжения. Поэтому чипы, использующие такие техпроцессы, потребляют мало энергии при низкой частоте и много - при высокой. Наглядно это можно увидеть на графике (CPU A - «быстрый» техпроцесс, CPU B - для малого потребления):

Упрощённо можно сказать так: быстрый техпроцесс лучше оптимизирован для работы на высоких тактовых частотах, а техпроцесс малого потребления - на низких частотах. И для того, чтобы «убить двух зайцев сразу», компания NVIDIA при помощи тайваньского производителя полупроводников TSMC воплотила в системе на чипе Kal-El достоинства обоих техпроцессов, получив и низкое энергопотребление и высокую производительность одновременно, скомбинировав два разных типа транзисторов в одном чипе.

Большинство полупроводниковых фабрик предлагают минимум два варианта для каждого из техпроцессов: общего назначения (G - general purpose) и низкого потребления (LP - low power). Их возможности примерно одинаковые, но поведение транзисторов немного отличается, как было описано выше. Чипы, произведённые по техпроцессу 40 нм «LP» на фабриках TSMC используют пониженное напряжение, не могут работать на высокой частоте и имеют низкие токи утечек. Чипы, использующие техпроцесс 40 нм «G», имеют иные характеристики - могут работать на высокой частоте, но утечки у них больше.

Для мобильных систем на чипе совершенно не обязательно, чтобы весь чип работал на высокой частоте, а вот его потребление и низкие утечки весьма важны. Для подобных целей ещё один вариант - техпроцесс LPG (low-power triple gate oxide), позволяющий сочетать на одном кристалле транзисторы с разными характеристиками.

Этот специализированный техпроцесс LPG был разработан в TSMC специально для требовательных к производительности мобильных применений. Данный технологический процесс предлагает комбинацию транзисторов общего назначения «G» и транзисторов низкого потребления «LP» на одном ядре. То есть в основном используются «LP»-транзисторы, но часть кристалла может состоять из быстрых «G»-транзисторов.

В NVIDIA Tegra 2 уже использовался подобный подход со «смешанным» техпроцессом, позволяющим размещать и «G»-, и «LP»-транзисторы на одном кристалле, но подключать их к разным цепям питания. Быстрые два ядра Cortex A9 и кэш-память второго уровня в Tegra 2 используют «быстрые» транзисторы типа «G», а остальная часть SoC, включая и графическое ядро, состоит из «LP»-транзисторов.

В Kal-El разработчики из NVIDIA пошли ещё дальше - теперь «LP»-транзисторы использует не только вся «обвязка», но и вспомогательное ARM-ядро, имеющее ровно те же возможности, что и основные ядра Cortex A9. Использование «LP»-транзисторов позволило снизить потребление энергии для этого ядра при работе на низких частотах по сравнению с главными ядрами CPU, основанными на «G»-транзисторах.

Проведённые в NVIDIA измерения энергоэффективности ядер Kal-El показали, что вспомогательное ядро обеспечивает лучшую, по сравнению с основными ядрами, эффективность при работе на частотах до 500 МГц. Так как вспомогательное ядро используется только в режимах простоя и исполнения фоновых задач, то его частоту ограничили именно этим значением, вполне достаточным для подобного применения.

Вспомогательное ядро Kal-El работает и в случае нетребовательных к вычислительной мощи CPU приложений, таких как запись и проигрывание аудио- и видеоданных - ведь их кодированием и декодированием занимаются специализированные блоки, входящие в состав SoC. А основные ядра SoC более эффективны при работе на высокой частоте. Поэтому в Kal-El используется комбинация высокопроизводительных основных ядер и оптимизированного для малого потребления энергии вспомогательного. Помните графики с процессорами «LP» и «G»? Совмещение их на одном и даёт понимание того, как работают ядра в Kal-El.

Представленная NVIDIA технология vSMP позволяет с успехом объединять плюсы малопотребляющего ядра CPU B и высокопроизводительных ядер CPU A, показанных на графике ранее. Когда выгоднее использовать вспомогательное ядро, то используется именно оно, а при повышении нагрузки включаются более производительные ядра. И в итоге мы получаем схему почти идеальной (пока что лишь теоретически) кривой показателя энергоэффективности системы на чипе Kal-El.

Со временем распараллеленных приложений должно стать больше, практически все задачи по обработке медиаданных могут быть переложены на несколько потоков. А уж многозадачность так и вообще всегда использует несколько ядер CPU, при условии использования современной операционной системы. В мобильных устройствах часто одновременно запущено несколько задач, в том числе и фоновых, и на одном ядре им всем иногда просто «тесно». И в таких условиях одноядерные SoC снова работают неэффективно, так как им приходится задирать частоту и напряжение до максимальных значений. А два или четыре ядра справятся с такой работой намного легче.

Четыре полноценных ядра против двух в Tegra 2 должны сильно помочь в игровых приложениях, особенно перенесённых с «больших» консолей или ПК, а также в мультиплатформенных проектах. Ведь старшие игровые платформы - все многоядерные, и их код обязательно распараллеливается для достижения высокой эффективности. Большинство современных игр на известных движках вроде Unreal, Id Tech 5 или Frostbite используют многопоточность. Отдельные потоки выполняют задачи обработки аудиоданных, определения столкновений объектов (collision detection), искусственного интеллекта, обработки данных от пользователя, сетевой код и т. п.

И как раз четырёхъядерные мобильные системы дадут возможность включать в игры такие продвинутые вещи, как сложные физические эффекты и процедурную генерацию текстур в реальном времени. В мобильных играх пока явно не хватает сложной динамики, вроде физически корректных взаимодействий между объектами, эффектов гравитации, ветра, имитации воды и других вещей, которые появляются в играх на ПК и консолях.

Но эти эффекты очень требовательны к вычислительным мощностям, для них нужно большое количество распараллеленных вычислений в реальном времени. И увеличение количества CPU-ядер в мобильных системах на чипе может дать явное увеличение сложности подобных эффектов. Процессор Kal-El позволяет считать на своих четырёх ядрах сразу несколько задач одновременно: динамическое освещение, физические эффекты, искусственный интеллект и т. д. При этом загрузка вычислительных ядер не максимальна, и ресурсов хватает и на фоновые задачи, вроде проверки почты, синхронизации и т. д.

Работа vSMP в операционной системе

Можно похвалить NVIDIA за нетрадиционный подход и интересное решение. Но как вспомогательное ядро работает в операционной системе, если та не рассчитывалась на такое хитрое применение? Android 3.x имеет поддержку многопроцессорных систем и вполне может использовать несколько вычислительных ядер, но поддержка эта сделана так, что все ядра должны обладать одинаковыми возможностями и производительностью. Android распределяет задачи по ядрам CPU, исходя из предположения об их одинаковости.

Поэтому для Kal-El пришлось сделать так, что вспомогательное ядро Cortex A9 «прозрачно» для операционной системы. Оно попросту недоступно для операционной системы и пользовательских приложений, а выполнение задач переключается между ядрами автоматически, при помощи специальных аппаратных и программных решений.

Специальная логика в Kal-El постоянно отслеживает загрузку CPU ядер, она способна автоматически и динамически включать и выключать вспомогательное ядро и основные CPU ядра. Решение о включении или выключении ядер принимается на основе текущей нагрузки и рекомендаций по тактовой частоте CPU от специализированной подсистемы, встроенной в ядро ОС.

Данная технология хороша ещё и потому, что она не требует каких-либо изменений в системе или специальной оптимизации приложений. Такой подход позволяет значительно упростить жизнь разработчикам приложений, но предъявляет довольно высокие требования к разработчикам самой Kal-El - такое переключение должно работать быстро, чётко и без проблем с совместимостью. Будем надеяться, что так оно и будет, а сейчас чуть подробнее рассмотрим, как работают вычислительные ядра в разных сценариях.

Когда вспомогательное ядро отключено и система использует основные ядра для вычислений, управляющая логика отслеживает загрузку каждого ядра CPU, динамически включая или выключая от одного до четырёх основных ядер. Как только потребление вычислительных ресурсов вспомогательного ядра превышает определённое значение, оно отключается, а его состояние пересылается к одному из основных ядер системы. Остальные пока не включаются, но если загрузка и первого основного ядра переходит через определённый предел, то включается следующее, и так далее. То же самое происходит и с отключением ядер - оно полностью динамическое.

Например, в случае простых приложений, вроде клиента электронной почты, SMS-клиента или просмотра несложных веб-страниц, системе потребуются мощности лишь одного из четырёх ядер Kal-El. В случае более требовательных приложений, типа многозадачной среды, просмотре «тяжёлых» страниц с Flash-анимацией, управляющая логика CPU может включить два основных ядра. Ну и для самых сложных случаев, вроде современных трёхмерных игр, перенесённых с настольных консолей, а также при обработке потоковых данных, в работу включатся все четыре ядра этой системы на чипе.

В случае системы Kal-El возможно полное отключение любого из вычислительных ядер в режиме простоя, а не только снижение частоты и напряжения, как было у предыдущего поколения - Tegra 2. Полностью отключенное ядро почти совсем не потребляет энергии, да и токи утечек весьма малы. Предыдущая система на чипе компании не могла отключать ядра по-отдельности, поэтому весьма вероятно, что во многих задачах Kal-El действительно будет потреблять меньше энергии, чем Tegra 2.

Технические решения и преимущества технологии vSMP

При проектировании чипа с архитектурой vSMP инженерам компании NVIDIA пришлось решить несколько непростых задач. Ведь сразу возникает вопрос - а как быстро переключаются ядра между главными и вспомогательным? Нет ли нежелательной задержки при этом, не замедляются ли приложения и не появляются ли неприятные лаги?

NVIDIA утверждает, что они решили вопрос скорости переключения между ядрами при помощи специальной логики, встроенной в Kal-El. В результате, полное время этого действия, включающее время переключения ядер и время стабилизации напряжения для включаемого ядра, по замерам NVIDIA не превышает 2 миллисекунды, что не должно быть заметно для пользователя.

При работе vSMP может возникнуть и такая сложная ситуация, когда система захочет переключаться то на основные ядра, то на вспомогательное, в случае если нагрузка будет меняться скачкообразно, постоянно активируя триггер, переключающий ядра. Такое поведение совершенно точно вызовет снижение производительности и энергоэффективности и для его минимизации в управляющую логику был введён дополнительный алгоритм, адаптирующийся к изменению вычислительной нагрузки и предотвращающий подобное поведение.

Вообще, технология vSMP неплохо выглядит, по крайней мере теоретически. Её единственным явным недостатком можно считать дополнительные затраты транзисторного бюджета (а вместе с этим и усложнение чипа) на то, что работает далеко не всегда. Но лишнее ARM ядро вряд ли заняло много места на кристалле, по сравнению со всем остальным, так что этим доводом против вполне можно пренебречь, перейдя к рассмотрению преимуществ.

И раз пока до практики дело не доходит, давайте попробуем рассмотреть чисто архитектурные преимущества данного решения перед подобными. К примеру, такими, как асинхронная частота ядер в системе, что применяется конкурентами NVIDIA. Например, двухъядерные системы Snapdragon от Qualcomm являются одними из лучших систем на чипе на рынке. Эта компания использует «LP» техпроцесс и асинхронную тактовую частоту для вычислительных ядер. Неким аналогом этого решения можно считать технологии настольных x86-процессоров вроде Intel Turbo Boost, когда каждое из ядер постоянно работает на своей частоте.

Но у такого подхода есть свои недостатки. Во-первых, это дополнительные расходы на синхронизацию кэшей между ядрами, работающими на разной частоте. А вот vSMP не позволяет вспомогательному и основным ядрам работать одновременно (и на разной частоте). Все пять ядер используют общую кэш-память, данные из которой возвращаются вычислительным ядрам с одинаковыми задержками (речь именно о времени, так как у главных и вспомогательного ядер на это затрачивается разное количество циклов).

Кроме того, NVIDIA заявляет, что у их решения выше эффективность, так как операционная система Android подразумевает, что все ядра одинаковы и работают на одной частоте. И если несколько ядер CPU работают на разных частотах, то они имеют разную производительность в данный момент времени. Что может вызвать неэффективное распределение вычислительных потоков по ядрам системы. С нынешними невысокими нагрузками это не очень большая проблема, но что будет при дальнейшем развитии многозадачности на коммуникаторах и планшетах? В случае чипов NVIDIA (это касается и Kal-El и Tegra 2) все активные ядра всегда имеют одну и ту же синхронизированную частоту.

Ещё один недостаток конкурирующих SoC заключается в том, что изготовление кристаллов по техпроцессу низкого потребления («LP») обходится производителю дороже, да и выход годных чипов, работающих на высокой частоте, не так велик. Хотя, сравнить эти показатели адекватно не получится, так как их никто никогда не раскрывает.

В общем, теоретически оригинальное решение NVIDIA выглядит неплохо, но как оценить эту эффективность распределения потоков по ядрам на практике - непонятно. Зато в случае с асинхронной частотой ядер можно управлять их потреблением гораздо более гибко. Но NVIDIA утверждает, что и тут они впереди. Каждое ядро при асинхронной работе требует отдельную цепь питания, чтобы регулировать подаваемое напряжение для каждого ядра отдельно. Что может вызвать ухудшение качества питания и отрицательно повлиять на производительность. И так как каждая линия питания требует своего набора регуляторов напряжения, то такие архитектуры хуже масштабируются, а также требуют больше вспомогательных элементов в электронном устройстве. А если линия питания одна, но все ядра всегда работают при одинаковом напряжении, то такой подход не даёт возможного увеличения энергоэффективности, ведь потребление зависит от больше от напряжения, чем от частоты.

Достоверно пока трудно сказать, правы ли инженеры NVIDIA в своих решениях, это можно будет оценить только практически сравнив различные варианты мобильных систем по производительности и потреблению энергии. Но из теории следует, что vSMP не имеет накладных расходов по синхронизации кэш-памяти и более эффективно распределяет задачи по ядрам, что должно означать большую производительность решения, по сравнению с конкурирующими SoC с асинхронной частотой.

Улучшение энергоэффективности

Как мы описали выше, технология vSMP даёт возможность значительной экономии энергии, но пока что мы об этом знаем лишь теоретически. В зависимости от сценариев использования мобильного устройства на базе Kal-El, технология vSMP динамически включает и выключает ядра CPU, чтобы достичь требуемой производительности при низком среднем уровне потребления энергии. NVIDIA даёт следующие цифры, сравнивая решения на базе Kal-El и Tegra 2, изготовленные по техпроцессу 40 нм:

Даже если не учитывать небольшую маркетинговую хитрость в виде начала координат не от 0%, а от 20%, можно уверенно сказать, что новый SoC от NVIDIA получился лучше предыдущего. Как видите, Kal-El во всех случаях обеспечивает меньшее энергопотребление, имея минимум вдвое большую пиковую производительность. LP0 - это режим минимально возможного потребления энергии, и улучшение энергоэффективности в нём явно связано с работой вспомогательного ядра. Да и в других актуальных режимах (особенно с проигрыванием видео и игровым приложением) новое решение явно лучше старого.

Но даже если не брать в расчёт улучшенную эффективность из-за применения архитектуры vSMP, то Kal-El должен потреблять меньше предыдущей системы на чипе. Ведь большее количество ядер способно выполнить ту же работу, что и меньшее, но со сниженным потреблением энергии. Причина этого в том, что четыре ядра будут работать при этом на более низкой частоте и напряжении. А так как потребление пропорционально частоте и квадрату напряжения, то общее потребление чипа при совершении той же работы будет меньше.

В качестве практического доказательства этого тезиса NVIDIA приводит цифры замеренного в их лабораториях энергопотребления и производительности для Kal-El и нескольких двухъядерных решений от конкурентов в тесте Coremark. Цифры потребления только ядрами CPU при этом получались при помощи вычитания потребления энергии в режиме простоя из цифры общего потребления, замеренного при выполнении теста.

Судя по этой таблице, система Kal-El способна выполнять ту же работу, что и её двухъядерные аналоги при вдвое-втрое меньшем энергопотреблении при работе на сниженной до 480 МГц частоте. Будучи же запущенной на частоте 1 ГГц, система NVIDIA обеспечивает вдвое большую производительность и при этом всё равно потребляет чуть меньше энергии, по сравнению с конкурентами.

Так получается именно потому, что Kal-El использует «быстрые» «G»-транзисторы для основных вычислительных ядер, оптимизированных в основном для получения высокой производительности, и эти ядра способны работать на высокой частоте под меньшим напряжением питания, по сравнению с конкурентами, вынужденными оптимизировать одни и те же ядра и для высокой производительности и для пониженного энергопотребления. Вот эти же цифры, только в более удобном графическом виде:

Вроде бы всё очень неплохо у новой SoC от NVIDIA с производительностью, но всё же хотелось бы практических измерений и в нашей лаборатории. А то ведь и частота Kal-El ещё явно не финальная, да и у конкурентов уже вышли более производительные модели систем на чипе, пусть пока только двухъядерные, но с частотой 1,5 ГГц. Плюс - это всё-таки лишь хорошо распараллеленный бенчмарк, а не практические задачи, которые не всегда так хорошо используют многоядерные возможности систем.

Производительность вычислительных ядер

Итак, по данным NVIDIA, их система на чипе Kal-El потребляет энергии меньше, чем двухъядерные и одноядерные решения. Одна из ошибок пользователей в том, что они думают, что многоядерник нуждается в большей энергии, чем одноядерное или двухъядерное решение. Так и есть в случае постоянной работы на максимальных частотах. Но, благодаря внедрению «переменной симметричной мультипроцессорности» (vSMP), пять ядер Kal-El более эффективны и дают большую производительность при меньшем или равном потреблении с одно- и двухъядерными системами.

Ведь для выполнения одной и той же задачи одноядерная система должна будет работать на значительно более высокой частоте при большем напряжении, да ещё и может потребовать больше рабочего времени на её выполнение. А многоядерная система распределит задачи на имеющиеся ядра, и каждое из них будет работать на меньшей частоте и требовать меньшего напряжения. Поэтому эти ядра будут потреблять значительно меньше энергии и будут эффективнее одноядерных.

При этом мобильные устройства на базе многоядерных систем на чипе способны использовать все имеющиеся возможности даже в таких задачах, как интернет-браузеры. Современные браузеры распараллеливают вычисления на имеющееся количество процессорных ядер, что делает работу в них более комфортной. В качестве примера NVIDIA приводит браузер с несколькими одновременно открытыми страницами.

Как видите, все ядра CPU в этой задаче заняты полезной работой. На многоядерных чипах операционная система распределяет вычисления на ядра так, что обеспечивает намного большую скорость загрузки и исполнения тяжёлых веб-страниц со скриптами. В известном тесте производительности скриптов Moonbat четыре ядра дают почти 50% дополнительной скорости, по сравнению с двухъядерным процессором.

Ещё больший прирост скорости многоядерные системы обеспечивают в таких требовательных приложениях, как обработка фотографий и видеоданных, перекодирование видео, сжатие данных и др. Немаловажной для мобильных систем является и высокая производительность в играх, которые становятся всё ближе к настольным версиям. Оценить производительность вычислений нового Kal-El компания NVIDIA предлагает по результатам популярного мобильного теста Coremark.

В сравнении участвовали: система на чипе Apple A5, известная по iPad 2, а также двухъядерные Texas Instruments OMAP4430, работающий на частоте 1 ГГц и Qualcomm MSM8660, работающий при частоте 1,2 ГГц. Четырёхъядерник Kal-El в этом сравнении имеет частоту 1 ГГц.

Относительные показатели Coremark (конкретные цифры смотрите в предыдущем разделе статьи) показывают, что четыре ядра Kal-El обеспечивают вдвое большую скорость вычислений, по сравнению с распространёнными двухъядерными системами на чипе. Соответственно, это примерно вчетверо выше скорости аналогичных одноядерных CPU. Надо упомянуть, что у TI и Qualcomm уже готовы и более производительные системы на чипе, работающие на 1,5 ГГц, что может изменить общую картину. Хотя и частота Kal-El пока доподлинно не известна.

Ещё более популярный тест производительности - это Linpack, который очень часто используется при сравнении процессоров разных архитектур и даёт представление о производительности CPU в требовательных задачах, вроде обработки потоковых данных. В случае мобильных решений сравнивается скорость в специальной Android-версии бенчмарка.

В этом сравнении NVIDIA дала только две цифры, причём сравниваются два и четыре ядра одного Kal-El, в первом случае ядра отключены и не работают. В результате, четырёхъядерник оказался на 55% быстрее своего двухъядерного аналога. Для реальных приложений это был бы неплохой результат, но для бенчмарка, который довольно хорошо масштабируется по количеству вычислительных ядер, мы считаем прирост в 55% довольно скромным.

Возможно, причины его - в несовершенстве Android-версии Linpack, которую можно скачать из Market, а может быть дело в архитектуре самой системы Tegra. Не секрет, что Linpack требователен не только к вычислительной мощности, но нуждается ещё и в пропускной способности памяти. А Kal-El, как и Tegra 2, имеет лишь один 32-битный канал памяти, работающий с памятью типа LPDDR2 или DDR3.

Хотя Kal-El поддерживает более высокую рабочую частоту для оперативной памяти, но ширина шины в этой системе не выросла, к сожалению. А ведь за полосу пропускания теперь будут бороться в два раза большее количество процессорных ядер и в 1,5 раза большее количество потоковых процессоров графического ядра. Так что вполне возможно, что именно это узкое место и ограничивает производительность Kal-El в некоторых задачах. Отметим, что некоторые конкуренты имеют поддержку двухканальной памяти уже сейчас.

Графическое ядро GeForce

К сожалению, NVIDIA пока что не слишком подробно рассказывает о модификациях графического ядра в Kal-El, и раскроет карты ближе к выходу конечных решений. Но мы всё же смогли узнать некоторую информацию об устройстве графического ядра нового чипа из своих источников. На самом деле, GPU в новой системе на чипе не слишком сильно отличается от графического ядра той же Tegra 2. Которое, к слову, аналогично применённому и в первой системе Tegra.

Из ранних утечек информации известно, что Kal-El имеет графическую часть с 12 «ядрами», как их назвали маркетинговые специалисты компании NVIDIA. И по оценке инженеров графика Kal-El быстрее видеоядра Tegra 2 примерно в 2-3 раза. Раз уж подробностей нам пока не раскрывают, попробуем разобраться сами.

В составе системы на чипе Tegra 2 есть два VEC4 блока, исполняющих по четыре команды за такт: по одному такому блоку на операции над вершинами и пикселями. То есть, говоря маркетинговым языком, всего в том чипе 8 «ядер». При этом к одному пиксельному VEC4 блоку «привязан» и один текстурный блок (TMU). Что же изменилось в Kal-El?

Нам стало известно, что в новый SoC включили уже три блока VEC4, аналогичных применённым в Tegra 2, но с некими архитектурными изменениями, вроде улучшений в алгоритмах отсечения невидимых фрагментов и увеличенных кэшей, а возможно и увеличенным количеством регистров. Теперь в Kal-El один VEC4 блок, обрабатывающий вершины (собственно, пока больше и не нужно), но уже два блока, работающих с пикселями. Всего - 12 графических «ядер».

И так как блоки TMU «привязаны» к ALU, то в следующей Tegra будет вдвое больше блоков TMU - то есть, два таких блока, а не один. Важнее то, что инженеры NVIDIA смогли значительно повысить частоты графического ядра, по сравнению с Tegra 2. Поэтому в тяжёлых приложениях с нагрузкой на попиксельные вычисления, можно действительно ожидать прироста производительности порядка 2,5-3 раз.

Теоретически, скорость текстурирования и затенения в Kal-El должна стать примерно на уровне лучших нынешних графических ядер в составе SoC. Тут необходимо сделать небольшое отступление о разнице между традиционными графическими архитектурами (GPU в Tegra) и тайловыми архитектурами (GPU остальных производителей современных систем на чипе). Тайловые архитектуры обладают лучшими показателями по эффективности, это касается и текстурирования и закраски (филлрейта). Они по своей природе меньше зависят от пропускной способности памяти и реже упираются в неё.

Но у тайловых архитектур есть и важный недостаток - необходимость посылать геометрию в параметрический буфер после вершинного шейдера. Поэтому установка геометрии (triangle setup) работает значительно медленнее на тайловых GPU, по сравнению с традиционными. То есть, тайловые GPU имеют меньшую эффективность в расчёте геометрически сложных сцен, и чем больше геометрии - тем хуже будет с ней справляться тайловая архитектура. Так было и с настольными GPU во времена KYRO от PowerVR. И так как модификации той архитектуры пришли в мобильные графические ядра, то вполне очевидно, что это повторится и в случае мобильных GPU.

Можно предположить, что Kal-El будет работать эффективнее в случае сложных портов с настольных консолей, а уж NVIDIA сможет сделать так, чтобы эти порты были. Собственно, они уже начинают, достаточно вспомнить показанную на тестовом образце с Kal-El игру Lost Planet 2. Программная поддержка у NVIDIA всегда была в числе сильных сторон, и дело даже не столько в драйверах, сколько в прочных связях с разработчиками программного обеспечения. Одна инициатива и входящие в неё эксклюзивные для NVIDIA Tegra игры чего стоят. Немудрено, что компания постоянно усиливает это направление - именно этим они выгодно отличаются от любого другого производителя систем на чипе.

Но давайте уже поговорим о производительности. Графическое ядро Kal-El с удвоенным числом текстурных блоков и блоков пиксельной обработки, работающих на более высоких частотах, а также архитектурные изменения - всё это в сумме даёт заявленный прирост в 2,5-3 раза. Причём, наибольшие приросты должны наблюдаться в современных играх с упором производительности в скорость пиксельных вычислений. И хотя NVIDIA не желает открывать полные данные об архитектуре GPU в Kal-El, некоторые данные о скорости в 3D они публике всё же дали:

Пока что нам показали лишь сравнительную производительность между двухъядерной Tegra 2 и четырёхъядерным Kal-El, без сравнения с конкурентами. Но с учётом того, что в играх скорость обычно сильнее зависит от мощности GPU, мы можем примерно представить себе прирост мощности графического ядра в Kal-El.

Для демонстрации графической мощи Kal-El были выбраны три приложения, которые NVIDIA показывала публике ранее. Демо-программа Glowball с физическими эффектами, скорее всего, сильно зависит от скорости CPU, а вот остальные два приложения говорят о том, что графическое ядро в новом SoC примерно вдвое быстрее, чем у предыдущего мобильного чипа компании - Tegra 2. Неплохой показатель, хотя и не достигающий заявленных трёх раз, но всё же выводящий это решение на уровень лучших конкурентов.

Мы видим, что ранние тесты, проведённые самой NVIDIA, подтверждают наши теоретические выводы. В «тяжёлых» графических задачах новый SoC более чем вдвое быстрее предыдущего. Kal-El должен позволить NVIDIA соперничать с другими системами на чипе, которые ранее обошли Tegra 2 по графической производительности. Ведь видеоядро Tegra 2 не может конкурировать на равных с тем же PowerVR SGX543MP2, который входит в состав чипа Apple A5, на котором основан популярнейший планшет iPad 2. А следующее поколение систем Tegra должно как минимум восстановить паритет, судя по представленным цифрам.

Другое дело, что конкуренты тоже не сидят, сложа руки. Выходящая в конце текущего года портативная консоль Sony PlayStation Vita будет основана на SoC, имеющем в своём составе мощнейший «четырёхъядерный» видеочип PowerVR SGX543MP4, который примерно вдвое мощнее своего двухъядерного аналога. Вполне вероятно, что и следующая версия Apple iPad также будет иметь намного более мощную графику от Imagination Technologies. Поэтому лёгкой прогулки для NVIDIA с их системой Kal-El явно не будет. С другой стороны, мы уже писали выше о том, что на смену Kal-El придёт Kal-El+, а потом и Wayne, графическое ядро которого должно получить намного более мощное графическое ядро новой мобильной архитектуры.

Выводы

Похоже, что у компании NVIDIA снова получится первой выпустить на рынок мощное четырёхъядерное решение для мобильных систем, как они сделали это ранее с двухъядерной системой на чипе Tegra 2. Но система Kal-El весьма интересна не столько просто своей мощью, сколько оригинальнейшим решением в виде дополнительного вспомогательного CPU ядра.

С ростом требований мобильных приложений к производительности систем на чипе, на которых основаны компактные решения, производители SoC не просто стараются использовать многоядерные решения, но и пытаются удержать потребление ими энергии в рамках, обычных для планшетов, нетбуков и даже коммуникаторов. Представленная в Kal-El технология vSMP должна улучшить энергоэффективность следующей системы на чипе от NVIDIA.

Новый SoC должен обладать лучшими качествами подобных систем - иметь минимальное потребление в режимах энергосбережения и малой нагрузки, но при этом обеспечить высочайшую производительность четырёх полноценных процессорных ядер, не выходя при этом за рамки потребления мобильных устройств. По данным NVIDIA, использование вспомогательного ARM ядра для фоновых и нетребовательных задач и подключение четырёх основных ядер в случае интенсивной нагрузки позволяет Kal-El обеспечить среднее потребление энергии ниже, чем у большинства конкурирующих решений при любом сценарии и нагрузке.

Четыре вычислительных Cortex A9 ядра и «переменная симметричная мультипроцессорность» должны помочь получить мощные мобильные устройства с отличной энергоэффективностью и длительным временем работы от батарей в большом количестве применений. Это весьма оригинальное решение проблемы одновременного увеличения производительности системы на чипе и снижения среднего потребления энергии, и будет очень интересно посмотреть на практике, как пятое ARM ядро с низким потреблением скажется на продолжительности работы от батарей в реальных устройствах.

Предварительные тесты скорости вычислений и энергопотребления подтверждают эффективность решения, но нужно ещё будет дождаться решений на Kal-El на рынке, а также систем от конкурентов NVIDIA, чтобы сравнить их в условиях нашей независимой лаборатории. Пока же отметим очень мощные теоретически CPU- и GPU-части в составе нового SoC. Хотя от компании, известной своими достижениями в области 3D-графики, хотелось бы чего-то значительно большего, чем очередное повышение частоты и увеличение количества исполнительных блоков в GPU. Но для большого рывка в производительности мобильной графики NVIDIA придётся подождать следующего поколения систем на чипе, использующего 28 нм техпроцесс.

Важно, что мощные мобильные SoC вроде Kal-El дадут возможность переноса и разработки игровых приложений с качеством, близким (но пока всё же уступающем, судя по известным проектам) к консольному у игровых приставок текущего поколения. Четыре вычислительных ядра и усиленное графическое ядро позволяют использовать более сложную геометрию объектов, продвинутые физические эффекты, сложный искусственный интеллект, процедурное текстурирование и т. п. И именно игры могут стать одним из тех локомотивов, которые сподвигнут пользователей на приобретение столь мощных мобильных устройств.

К сожалению, есть у Kal-El и недостатки. Одним из них мы считаем то, что при всём повышении количества исполнительных устройств (вычислительные ARM ядра, векторные блоки графического ядра), новая система на чипе до сих пор имеет лишь один контроллер и канал памяти. Это - весьма странное архитектурное решение, когда канал памяти не расширился при куче изменений: удвоенном количестве CPU ядер, добавлении к ним возможности исполнения инструкций NEON, добавлении шейдерных блоков к GPU. И эта странность вполне может объяснить менее чем двукратный прирост производительности в некоторых тестах и может серьёзно помешать в конкурентной борьбе с будущими системами от Qualcomm, Texas Instruments, Samsung и другими.

Но это - один из немногих технических недостатков, который мы нашли в новом решении. Что касается рыночных перспектив компании NVIDIA в мобильном секторе, то тут они в очень хорошем положении со своими решениями под маркой Tegra. Конечно, очень жаль, что и Tegra 2 и Kal-El немного опоздали с выходом на рынок относительно первоначальных планов компании, но даже при этом они остаются весьма конкурентоспособными на развивающемся стремительными темпами рынке.

Мы уверены, что система на чипе Kal-El, которую мы сегодня рассмотрели, будет применяться в мобильных устройствах не менее широко, что и предыдущее поколение - Tegra 2. Произведённая модификация Kal-El+ должна усилить позиции компании, а Wayne так и вообще может стать одним из первых решений с ARM архитектурой, который потеснит x86-процессоры из ниши более высокого уровня - ноутбуков. Но это дело будущего, а появление планшетов и других мобильных устройств (нетбуков или смартбуков) на базе рассмотренной сегодня системы на чипе NVIDIA Kal-El ожидается в течение следующей пары-тройки месяцев. Собственно, к рождественским продажам NVIDIA с партнёрами успеть должны, а нам остаётся только ждать этого.