百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

一线互联网公司字节跳动后端开发视频架构面经总结

wptr33 2025-01-23 21:52 47 浏览

这篇文章主要介绍了字节跳动后端开发视频架构面经总结,觉得挺不错的,现在分享给大家,也给大家做个参考。一起过来看看吧

背景

面试方式:视频面(一面)

部门:字节跳动-视频架构-后端开发

主要根据简历上的内容(项目和技能)来问

面试题

1. 视频流的传输方式?(项目)

答:点对点传输,第三方流媒体服务器传输,自主搭建流媒体服务器传输;

2. 项目中是采用UDP-Socket实现心跳包,为什么采用UDP?(项目)

答:心跳包它像心跳一样每隔固定时间发一次,以此来告诉服务器,这个客户端还活着。其实TCP和UDP都可以实现心跳包,心跳包采用TCP还是UDP根据项目需要,采用UDP是因为它的速度快,占资源少。

速度快:TCP必须建立连接,而UDP是一个非连接的协议,所以UDP更快;

占资源少:UDP的数据报头部只有8个字节,而TCP数据报头部是20个字节;

3. TCP与UDP的区别?

答:1 基于连接和无连接;

2 TCP是可靠,保证数据正确;UDP不可靠,不保证数据正确;

3 TCP保证数据顺序到达;UDP不保证数据顺序到达;

4 TCP速度慢,因为TCP必须创建连接;UDP速度较快,不需要建立连接;

5 因为上述开销,TCP是一个重量级协议;UDP是一个轻量级的协议;

6 一个TCP数据包报头的大小是20字节;一个UDP数据报报头是8个字节;

7 TCP有流量控制和拥塞控制;UDP不能进行流量控制;

8 TCP面向字节流;UDP面向报文;

9 应用场景不同,TCP适合对效率要求相对低,但对准确性要求相对高或者是有连接的场景,TCP一般用于文件传输(HTTP,HTTPS,FTP等协议),邮件(POP,SMTP等协议),远程登录等场景;UDP更适合对效率要求相对高,对准确性要求相对低的场景,UDP一般用于即时通信(QQ聊天),在线视频(rtsp流速度一定要快,偶尔丢包没关系),网络语音电话等场景;

4. TCP四次挥手讲下?为什么有TIME_WAIT?

答:

1. A不能保证最后的ACK能达到B,如果最后的ACK丢失, 那么B显然收不到, B于是发起了重传FIN的操作, 此时如果A处于CLOSED的状态, 就没办法给对端发ACK了,所以A应该等一段时间,这段时间就是所谓的TIME_WAIT。

2. 保证新旧四元组互不干扰,假设tcp连接是:A(1.2.3.4:8888)------B(6.7.8.9:9999), 这就是一个tcp四元组。

当tcp连接关闭后, 四元组释放。 后面的新连接可能会重用到这个四元组(有这个可能性), 那么问题就来了: 新四元组和旧四元组完全一致, 他们的网络包会混乱吗?

所以,可以考虑这样一个机制:让旧四元组对应的所有网络包都消失后(等一段时间),才允许新四元组建立,颇有点锁的味道。这个等一段时间就是2MSL。

5. TCP比UDP多消耗哪些系统资源?

答:TCP建立连接时三次握手,断开连接时四次挥手;TCP数据包头部20字节,UDP数据包头部8字节;TCP有流量控制和拥塞控制。

6. UDP在内网下有几种NAT方式?

答:NAT(Network Address Translation)即网络地址转换,NAT能将其本地地址转换成全球IP地址。 考虑到UDP的无状态特性,目前针对其的NAT实现大致可分为Full Cone、Restricted Cone、Port Restricted Cone和Symmetric NAT四种。

7. 你了解DDoS攻击吗?

答:拒绝服务攻击(简称DoS攻击),亦称洪水攻击,其目的在于使目标计算机的网络或系统资源耗尽,使服务暂时中断或停止,导致其正常用户无法访问。

当黑客使用网络上两个或以上被攻陷的计算机作为“僵尸”向特定的目标发动“拒绝服务”式攻击时,称为分布式拒绝服务攻击(distributed denial-of-service attack,简称DDoS攻击)。

8. Nginx了解吗,讲一下?

答:Nginx 采用的是多进程(单线程) & 多路IO复用模型。

工作模式:

(1)、Nginx 在启动后,会有一个 master 进程和多个相互独立的 worker 进程。

(2)、接收来自外界的信号,向各worker进程发送信号,每个进程都有可能来处理这个连接。

(3)、master 进程能监控 worker 进程的运行状态,当 worker 进程退出后(异常情况下),会自动启动新的 worker 进程。

9. Nginx中master进程和worker进程是怎么通信的?

答:nginx的进程通信分为三种类别:linux 系统与nginx 通信(信号),master 进程与worker进程通信(套接字),worker进程间通信(共享内存)。

(1) linux 系统与nginx 通信

答:linux 系统与nginx是通过信号进行通信的,通过信号控制nginx重启、关闭以及加载配置文件等。比如:./nginx –s quit 向master进程发送信号。

(2) master 进程与worker进程通信

答:master进程与worker进程通过频道(channel)进行通信。创建频道,其实就是socketpair,在启动worker进程时创建频道;

发送消息,master进程通过ngx_signal_woker_processes向worker进程发送消息;响应消息,worker进程通过ngx_read_channel读取消息,然后根据command判断是什么消息。

(3) worker进程间通信

答:worker进程间则是通过共享内存进行通信。它通过 mmap 或者 shmgat 系统调用在内存中创建了一块连续的线性地址空间,而通过 munmap 或者 shmdt 系统调用可以释放这块内存。

使用共享内存的好处是当多个进程使用同一块共享内存时,在任何一个进程修改了共享内存中的内容后,其他进程通过访问这段共享内存都能够得到修改后的内容。

10. 为什么worker进程数和CPU数一致?

答:一是Nginx一般只做高并发代理,基本没用IO操作,算是CPU密集型操作,所以在处理时基本是瞬间完成的,很少出现IO阻塞。

二是进程与CPU调度的关系,单个核心处理多个进程的时候,是排队处理的,所以将worker进程数量设置超过核心数会造成不必要的上下文切换。

11. 多进程上下文切换讲下?

答:上下文切换:为了控制进程的执行,内核必须有能力挂起正在CPU上运行的进程,并恢复以前挂起的某个进程的执行。这种行为被称为进程切换。

因此可以说,任何进程都是在操作系统内核的支持下运行的,是与内核紧密相关的。 从一个进程的运行转到另一个进程上运行,这个过程中经过下面这些变化:

1. 保存处理机上下文,包括程序计数器和其他寄存器。

2. 更新PCB信息。

3. 把进程的PCB移入相应的队列,如就绪、在某事件阻塞等队列。

4. 选择另一个进程执行,并更新其PCB。

5. 更新内存管理的数据结构。

6. 恢复处理机上下文。 注:总而言之就是很耗资源。

12. 讲一下同步,异步,阻塞,非阻塞,多路IO复用?

答:当一个同步调用发出后,调用者要一直等待返回消息(结果)通知后,才能进行后续的执行;当一个异步过程调用发出后,调用者不能立刻得到返回消息(结果)。

实际处理这个调用的部件在完成后,通过状态、通知和回调来通知调用者。阻塞调用是指调用结果返回之前,当前线程会被挂起,一直处于等待消息通知,不能够执行其他业务。

非阻塞是指在不能立刻得到结果之前,该函数不会阻塞当前线程,而会立刻返回。

13. Nginx属于以上哪种类型?

答:Nginx采用异步非阻塞的事件处理机制,由进程循环处理多个准备好的事件,从而实现高并发和轻量级。

14. 讲一下epoll?

答:epoll是在2.6内核中提出的,是之前的select和poll的增强版本。

相对于select和poll来说,epoll更加灵活,没有描述符限制。epoll使用一个文件描述符管理多个描述符,将用户关系的文件描述符的事件存放到内核的一个事件表中,这样在用户空间和内核空间的copy只需一次。

15. 讲下epoll和select的区别?

答:1.select单个进程能够监视的文件描述符数量一般是1024,有数量限制,可以通过修改宏定义甚至重新编译内核来修改,但是会造成效率的降低。

epoll监视的描述符数量不受限制,支持的FD是最大可以打开文件数目。在1GB内存的机器上大约是10万左右。

2.select每次调用都会对socket集合中所有的socket,如果socket集合较大,效率就会线性下降;

epoll不存在这个问题,epoll只会对“活跃”的socket进行操作,

每个fd上有个callback函数,只有“活跃”的socket才会主动去调用callback函数,其他idle状态socket不会。

3.epoll使用mmap加速内核态与用户态的消息传递;Epoll是通过内核与用户空间mmap处于同一块内存实现的。避免了不必要的内存拷贝。

两个编程题:

1 给一个有向图,判断有向图中是否有环,如果有环,环的数量是多少?

2 给一个大小为n的数组,寻找比k小的最大数的位置。

面试经验总结

建议:

1 简历上的东西一定要非常熟悉再熟悉;

2 算法题一定要多刷再多刷;

到此这篇关于字节跳动后端开发视频架构面经总结的文章就介绍到这了,更多相关视频架构面试内容整理了 1000 道 2020年多家公司 java 面试题 400 多页 pdf 文档,还有几百页的Java核心知识点PDF。

关注私信【555】获取,还可领取更多Java面试题资料

相关推荐

[常用工具] git基础学习笔记_git工具有哪些

添加推送信息,-m=messagegitcommit-m“添加注释”查看状态...

centos7安装部署gitlab_centos7安装git服务器

一、Gitlab介1.1gitlab信息GitLab是利用RubyonRails一个开源的版本管理系统,实现一个自托管的Git项目仓库,可通过Web界面进行访问公开的或者私人项目。...

太高效了!玩了这么久的Linux,居然不知道这7个终端快捷键

作为Linux用户,大家肯定在Linux终端下敲过无数的命令。有的命令很短,比如:ls、cd、pwd之类,这种命令大家毫无压力。但是,有些命令就比较长了,比如:...

提高开发速度还能保证质量的10个小窍门

养成坏习惯真是分分钟的事儿,而养成好习惯却很难。我发现,把那些对我有用的习惯写下来,能让我坚持住已经花心思养成的好习惯。...

版本管理最好用的工具,你懂多少?

版本控制(Revisioncontrol)是一种在开发的过程中用于管理我们对文件、目录或工程等内容的修改历史,方便查看更改历史记录,备份以便恢复以前的版本的软件工程技术。...

Git回退到某个版本_git回退到某个版本详细步骤

在开发过程,有时会遇到合并代码或者合并主分支代码导致自己分支代码冲突等问题,这时我们需要回退到某个commit_id版本1,查看所有历史版本,获取git的某个历史版本id...

Kubernetes + Jenkins + Harbor 全景实战手册

Kubernetes+Jenkins+Harbor全景实战手册在现代企业级DevOps体系中,Kubernetes(K8s)、Jenkins和Harbor组成的CI/CD流水...

git常用命令整理_git常见命令

一、Git仓库完整迁移完整迁移,就是指,不仅将所有代码移植到新的仓库,而且要保留所有的commit记录1.随便找个文件夹,从原地址克隆一份裸版本库...

第三章:Git分支管理(多人协作基础)

3.1分支基本概念分支是Git最强大的功能之一,它允许你在主线之外创建独立的开发线路,互不干扰。理解分支的工作原理是掌握Git的关键。核心概念:HEAD:指向当前分支的指针...

云效Codeup怎么创建分支并进行分支管理

云效Codeup怎么创建分支并进行分支管理,分支是为了将修改记录分叉备份保存,不受其他分支的影响,所以在同一个代码库里可以同时进行多个修改。创建仓库时,会自动创建Master分支作为默认分支,后续...

git 如何删除本地和远程分支?_git怎么删除远程仓库

Git分支对于开发人员来说是一项强大的功能,但要维护干净的存储库,就需要知道如何删除过时的分支。本指南涵盖了您需要了解的有关本地和远程删除Git分支的所有信息。了解Git分支...

git 实现一份代码push到两个git地址上

一直以来想把自己的博客代码托管到github和coding上想一次更改一次push两个地址一起更新今天有空查资料实践了下本博客的github地址coding的git地址如果是Gi...

git操作:cherry-pick和rebase_git cherry-pick bad object

在编码中经常涉及到分支之间的代码同步问题,那就需要cherry-pick和rebase命令问题:如何将某个分支的多个commit合并到另一个分支,并在另一个分支只保留一个commit记录解答:假设有两...

模型文件硬塞进 Git,GitHub 直接打回原形:使用Git-LFS管理大文件

前言最近接手了一个计算机视觉项目代码是屎山就不说了,反正我也不看代码主要就是构建一下docker镜像,测试一下部署的兼容性这本来不难但是,国内服务器的网络环境实在是恶劣,需要配置各种镜像(dock...

防弹少年团田柾国《Euphoria》2周年 获世界实时趋势榜1位 恭喜呀

当天韩国时间凌晨3时左右,该曲在Twitter上以“2YearsWithEuphoria”的HashTag登上了世界趋势1位。在韩国推特实时趋势中,从上午开始到现在“Euphoria2岁”的Has...